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Avant-Propos 

Cet ouvrage de Statistique Descriptive s'adresse aux 
£tudiants de la premiere annee universitaire, premier et deux&me 
semestres de toutes les filieres de la nouvelle g£n£ration des 
Licences Fondarnentales en sciences, sciences 6conomiques et 
gestion...ainsi qu'aux £tudiants de la premiere ann£e des £coles 
d'ing£nieurs et des 6coles sup£rieures de commerce et gestion. 

Cest un support de cours et des exercices, pr£sentant les 
notions de base de la Statistique. II dispense, done, les £tudiants de 
prendre des notes de cours, n£anmoins, il les invite h faire un bon 
nombre d'exercices, extraits des contrdies et des examens, 
pr£sentes k la fin de chaque chapitre. 

M. EI Merouani 
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Statistique Descriptive Introduction a la Statistique 

Chapitre : 



Introduction a la Statistique 



L-Origine et definitions: 

Le terme STATISTIQUE provient du mot latin STATUS due 
aux premieres activity relatives h l'Etat telles que les 
recensements de la population, la collecte et la quantification de 
l'information,... etc. De-1& provient ('utilisation du terme 
STATISTIQUE (ou STATISTIQUES au pluriel) pour se r£ferer a 
une quantity d'information numerique collectee aupr$s de 
plusieurs situations telles que les accidents de la circulation, les 
indices de la bourse, les indices des prix, le Chomage, les votes 
aux Elections,... etc. que nous sommes habitues de lire ou 
d'entendre dans les moyens de communication. 

Nous donnons, ci-dessous, deux manures de definir la 
Stdtistique ou les Sciences Statistiques que nous considerons les 
plus generates et en meme temps qui incluent les composantes 
basiques de la plupart des theories Statistiques : 

V. Barnett (1973), « Comparative Statistical Inference », 
John Wiley & Sons : (( La Statistique se definie comme l'etude et la 
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recherche de ['information qui doit £tre utilis£e dans l'orientation 
pour prendre one action dans une situation pratique qui comporte 
une incertitude)). 

ML De Groot (1970), « Optimal Statistical Decision », 
McGraw Hill : (( Les Sciences Statistiques s'occupent du 
developpement des theories et techniques approprifo pour faire 
des inferences sous les conditions d' incertitude et d' ignorance 
partieile qui existent necessairement dans un large champ 
d'activites)). 

Les deux definitions anterieures comprennent plusieurs termes 
que necessitent une description et un commentaire plus detailtes, 
mais, nous, dans ce cours d'initiation, nous les surpassons pour 
d^velopper 1'aspect pratique de la Statistique. 

IL-Termes usuels de la statistique : 
l.-Population : 

L' ensemble ^tudie par la statistique s'appelle Population. C'est 
l'ensemble statistique de reference sur lequel seront effectuees des 
applications quantitatives. On la note Q. 
Exemples : 

■ Ensemble des entreprises d'un secteur, 

■ Pieces produites par une usine, 

■ Ventes r£alisees par un reseau de detail lants, etc. 
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2.- Individu: 

C'est la partie elementaire d'une population (d£finie selon les 

besoins de l'£tude). On le note CO. 
Exemples : 

■ Une entreprise, 

■ Une piece produite, 

■ La vente d'un d£taillant. 

3.- Caractere: 
C'est la caracteristique qui sert k d£crire un individu d'une 
population. C'est done une propri£t£ commune des individus 
selon laquelle on va mener l'ttude statistique. On le note X . Le 
caractere peut etre quantitatif, mesurable ou qualitatif non 
mesurable. Dans le cas quantitatif, le caractere X s'appelle une 
variable statistique ou il est mesurable par une variable statistique. 
Alors, cette variable X peut etre continue (XeIR ou & des 
inter valles de IR ) ou discontinue c'est-&-dire discrete (XgIN ). 
Exemples: 

Chiffre d'affaires, valeur ajoutee, effectif des employes.,, sont des 
caracteresquantitatifs appliques & une entreprise. 
Image de marque, climat social solidity firtanci&re sont des 
exemples de caracteres qualitatifs, non mesurables directement 
par une variable. , 
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4.- Modalites : 

Ce sont ies differentes situations ou formes que peuvent prendre les 
individus selon le caractere etudie. On les note .v ( . Les differentes 
modalites doivent etre a la fois incompatibles. c'est-a-dire que chaque 
individu a une et une seule modalite, el exhaustive, e"est-a-dire les 
modalites englobent toute la population. 
Exemples : 

Les formes que peut prendre un caractere : 

• bon ou mauvais pour une piece controls. 

• les classes de chiffres d'affaires definies par le banquier pour 
estimer le niveau de risque. 

• les classifications du personnel employ^. 

• etc. 

5.- Effectifs ou frequences ahsolues : 

L'effectif est le nombre d'individus presentant chaque 
modalite ou le nombre de fois qu'une modalite est observee, on 
l'appelle aussi la frequence absolue. On le note "ni". 
Exemple : 

Les etudiants de ia 1*" annee §co, & gestion sont etudies 
selon le nombre de leurs frferes et soeurs. Alors on a ; 

• population : ['ensemble des etudiants de la I 1 '"' ann£e £co. & 
gestion. 

• individus : etudiants. 

• caractere : nombre des fr£res et soeurs (quantitatif et discret). 

• modalites : 0, 1,2,3,4, 5,... 
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. effectifs : 10,20,30, 40, 25,12,. .. 
6.- Effectif total ; 
L'effcctif total est la somme des ct'f edits ; on le note N ct on a : 




( k eiant Ic nombrc des moduli tes). 

7.- Frequence relative: 

La frequence relative (ou frequence tout court) est la 
proportion d'individus ayant la meme modality dans la 

population etudi£e, on la note f, . C'est le rapport entre I'effectif 



de la modaliteet I'effectif total : 




(fc etant le 



nombre des modalites). 
Kemamues: 

■ Lorsqu'on rnultiplie une frequence relative par 100, on obtient 

le pourcentage de la modalite a, dans le total de la population. 

■ La somme des frequences relatives est egale a 1 . En effet ; 



I,/: = t-f— * 



N 



= K = l 

.v 



i-i 



ii 
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Statistique Descriptive Representation des donnees 

Chapitre 1 : 



Representation des donnees 



L-Introduction : 

Dans leur £tat brut les informations ne peuvent etre 
utilisees, d'ou la n£cessite de les "mettre en ordre", e'est-ci-dire de 
les ranger. 

A ce stade, elles ferment une distribution ou une sSrie 
statistique representant un ensemble des modalites et des effectifs 
d'un caraetere. 
IL-Tableaux statistiques : 

Le tableau correspondant aux series h un seul caractere est & 
simple entree, dans lequel figurent deux colonnes : l'une pour les 
modalitgs prise par la variables (x.) et 1'autre pour les effectifs 
correspondantes (n,). 

La presentation d'un tableau statistique fait correspondre a 
chaque modalite xi un "effectif ou "frequence absolue" ni. 
I.- Cas des caracteres uualitdtifs : 

Dans ce cas, les caractSres ne sont pas mesu rabies, on peut 
done les ranger dans un tableau statistique selon une logique qui 
permet au mieux I'interpretation. 
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Exemple : 

Distribution des employes d'une multinationale selon ieur 

nationalite : 



Nationality (xi) 


Effect if s (m) 


Marocains 


1450 


Frangais 


120 


Tunisiens 


50 


Espagnoles 


28 


Autres 


7 




N = 1655 



2.- Cas des caracteres quantitatifs : 

Lorsque le caractere est quantitatif, il taut distinguer te cas 
des variables discretes du cas des variables continues. 

a.- Variables statistiques discretes : 

Dans ce cas, les valeurs \i sont discretes et correspondent 
chacune £ un effectif ni , 

Exemple : 

Soil la distribution statistique representant le nombre des 

treres et seeurs des etudiants de la 1*" <t\w\ee eco. & gestion : 
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Freres ei soeurs (x-,) 





1 
2 
3 
4 
5 
6 
7 
8 
9 
10 



Effectifs (m) 



10 

20 

30 

40 

25 

12 

10 

8 

4 

2 

1 



N = 162 



b.- Variabl es statistiques continues: 

Dans ce cas, les valeurs prises par la variable ne sont pas 
entieres, ce qui necessite la creation de classes de valeurs possibles 
definies par lesextremites de classes (ou homes). 



tixemple : 

Soil la distribution statistique des employes d'une enrreprise selon 
leurs salaires mensuels en dirhams : 



14 



€ETlfcUP 



.com 



Statistiuue Descriptive 



Representation des donnees 



Saldires en DH (xi) 


Effectifs (m) 


< 2500 


2 


[2500,3500[ 


4 


[350O,450O[ 


11 


[4500.5500[ 


5 


>5500 


3 




N= 25 



Remarque : 

■ La division de la serie en classes se fait selon la nature du sujet 
traite, elle releve done du statisticien et de son appreciation du 
problems : 

— « Si l'intervalle est petit, le nombre de classes sera 
important et petit rendre les calculs plus compliqu^s. 
— Si l'intervalle est grand, ['information se perd a cause 
de la condensation des chiffres. 

■ Dans le cas des variables statistiques continues, les modalit£s xi 
appartiennent h des intervalles de la forme [e,-i, ei [que Ton 
appelle des classes et qui ont un centre : 



QP-x^f a 




•I* 



1< 
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— Ces interval les ou classes ant une largeur ou 
amplitude : 



a i = e , -e w 



Exemple : 

Dans l'exemple precedent, les centres et amplitudes de classes 
sent : 



lew, ei[ 


ni 


• 

CI 


ai 


fi 


% 


<2500 


? 

si 


— 


— 


0,08 


8% 


[250O,35O0[ 


4 


3000 


1000 


0,16 


16% 


[3500.4500[ 


11 


4000 


1000 


0,44 


44% 


[450O,55OO[ 


5 


5000 


1000 


0,2 


20% 


>5500 


3 


— 


— 


0,12 


12% 




N = 






Z/;=i 


100% 




25 











■ On a complete le tableau, en y ajoutant les frequences relatives, 
calcul£es comnie on a vu, en utilisant la formule : 




■ On a aussi calcule les pourcentages : a chaque tote, on a 

mtiltiplie par 100 les frequences relatives. 
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III.-Effectifs cumules et frequences cumulees ; 

1.' Effectifs cumules croissants : 

I/effect if cumule croissant est le nombre de fois qui se 
pr^sente une modality ou plusieurs inferieures h une valeur 
donnee. On le note nicf ou nice. II se calcule en totalisant les 
effectifs avec ceux des classes suivantes. II sert a repondre aux 
questions qui dernandent un nombre ou un effectif « moins de » 
ou « inferieur a » une valeur donnee. 
2.- Effectifs cumules decroissants : 

L'effectif cumule dScroissant est le nombre de fois qui se 
pr&ertte une modalite ou plusieurs superieures a une valeur 
donnee. On le note nici ou nicd. II se calcule en totalisant les 
effectifs avec ceux des classes anterieures. II sert & repondre aux 
questions qui dernandent un nombre ou un effectif « plus de » ou 
« superieur a » une valeur donnee. 
3.- Frequences cumulees croissantes : 

Une frequence cumulee croissante est la proportion des 
modalit£s « inferieur k » ou « moins de » une valeur donnee. On la 
note fict ou ficc. Elle se calcule en totalisant les frequences 
relatives avec eel les des classes suivantes, ou en calculant le 
rapport de I'effectif cumuli croissant et I'effectif total : 
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Je Frequences cumulees d6croissantes : 

Une frequence cumulee decroissante est la proportion des 
modalit6s « superieur a » ou « plus de » une valeur donnee. On la 
note fici ou ficd. Elle se calcule en totalisant les frequences 
relatives avec celles des classes anterieures, ou en calculant le 
rapport de l'effectif cumuli decroissant el I'effectif total : 

Exemple : 

Pour l'exemple precedent, calculons les effeetifs cumulus et les 
frequences curnulees : 



[ew, ei[ 


m 


fi 


nicj 


fid 


nic| 


fie] 


<2500 


9 

mm 


0,08 


2 


0,08 


25 


1 


[2500, 3500[ 


4 


0.16 


6 


0,24 


23 


0,92 


[35O0.4500[ 


11 


0,44 


17 


0,68 


19 


0,76 


[4500,5500[ 


5 


0,2 


22 


0.88 


8 


0, 32* 


>5500 


3 


0,12 


25 


1 


3 


0,12 




N = 


Z/=i 












25 













On peut done dire d'aprSs ces calculs que, par exemple, 68% des 
salaries gagnent moins de 4500 DH/mois.et 32% des employes 

ont un salaire sup£rieur £ 4500 DH/mois. 
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Dans l'entreprise de cet exemple qui a un total de 25 employes, 
1 7 parmi eux gagnent moins de 4500 DH/mois et 8 ont un 

salaire superieur h 4500 DH/mois. 

5.- Fonction de repartition : 

Etant donnee une serie statistique correspondante a la variable 

statistique X, 

la fonction de repartition F(x) est definie par : 

Flx) = J]cc 

avec f t ccest la frequence cumulee croissante : 

et jr M <x< \) si X est discrete ou qualitative 
ou «r M < .r < e. si X est continue. 

Done P(x) = y\fi si X est discrete ou qualitative 



\<x. 



et F(x)-« jLfj si X est continue. 

IV .-Representations graphiques : 

On a vu que Ton repr£sente les series statistiques par des 
tableaux, mais ces tableaux restent parfois insuffisants pour voir, 
par exemple, si une variable croit, decroit ou reste constante ; ou si 
elle presente autres caract£ristiques. Les representations 
graphiques peuvent nous donner une vue immediate et complete 
des phenomenes etudies. 
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Les representations graphiques different selon la nature des 
variables etudiees. 

1»- Caractfrres quanritatifs : 

Dans ce cas, il faut faire la distinction entre les variables 
statistiques continues et discretes. 

a.- Variables statistiques discretes : 

*- Le diagramme en batons : 
Le diagramme en batons represente les frequences fi ou les 
effectifs m correspondants & chaque valeur de 3a variable Xi 

Exemple : 

Soit la serie statistique donnant le nombre des fr£res et 
soeurs des 30 etudiants de la 1*» ann£e £co. & gestion : 



Xi 


nj 


fi 





2 


0,067 


1 


3 


0,1 


2 


5 


0,167 


3 


10 


0,333 


4 


7 


0,234 


5 


2 


0,067 


6 


1 


0,033 




N=30 


1 



20 
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o.m 



0.241 




12 3 4 5 6 

Diagramme en batons des frequences relatives 
*-La courbe cumulative : 

La courbe cumulative est une fonction de distribution qui 
represente les effectifs cumules croissants nict en fonction des 
modalites Xi . 

Elle permet de determiner la proportion des individus de la 
population dont le caractere est inferieur h une certaine valeur Xi. 
Elle est representee par une courbe en "escaliers" dont les paliers 

sont horizontaux. 
Exemple : 

Soit la s£rie statistique quantitative discrete suivante (des 
nombres de fr£res et sceurs de 30 £tudiants). 
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Xi 


ni 


IljCC 





2 


2 


1 


3 


5 


2 


5 


10 


3 


10 


20 


4 


7 


27 


5 


2 


29 


6 


1 


30 




N=30 





30 
29 

27 



20 



10 



5 



+ 



Q 



i 



; j 

r*-r 






7 

■ 



2 3 4 5 

Courts cumulative 






*; 
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Pour la lecture du graphique, on dit par exemple que 20 

etudiants ont moins de 4 fibres et sceurs. 

b.- Variables statisriaues continues : 

Comme pour ce type de variables, il y a une infinite de 
valeurs intermediates n£cessitant le recours & des classes, on ne 
peut pas utiliser le diagramme en batons. On se propose d'utiliser 
la representation des surfaces des classes par un histogramme. 

*-'l/histagramme : 

Pour tracer l'histogramme d'une variable statistique 
quantitative continue, on doit distinguer deux cas selon si les 
amplitudes des classes sont Sgales ou differentes. 

*- Cas des amplitudes egales : 

Exemple : 

Soit la serie repr£sentant les notes des 6tudiants en 

Informatique : 



[es-i, ei| 


ni 


fi 


[0,5[ 
[5,10[ 
[10,15[ 
[15,20[ 


60 
120 
200 
20 


0,15 
0,30 
0,50 
0,05 




N=400 


i 



f. = n ' 



N 
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On remarque que I'amplitude de a* = e* - ei-i = 5 pour toutes les 
classes. 



% 



0,30 



0,15 



0,05 




0,30 



Histogramme des frequences relatives 

L'histogramme est la surface hachur£e. 

On peut aussi repr£senter un histogramme pour les ni 

*- Cas des amplitudes differentes : 
Exemple : 

Le salaire annuel des 100 employes d'une entreprise se 
r£partit comme suit : 



24 
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Salaire annuel en 1000 Dh 


Nombre d'employes 


[0,30[ 
[30,50[ 
[50,90[ 
[90,1 20[ 


10 

48 

34 

8 


Total 


100 



Representors 1'histogramme de cette distribution. 

Pour homog6n£iser la distribution et tenir compte de 
l'inegalite des amplitudes, on dresse le tableau suivant : 



[ei-i, ei[ 


nj 


fi -ni/ N 


ai= ei - ei-i 


hi=m/ai 


[0,30[ 


10 


0,1 


30 


0,33 


[30,50[ 


48 


0,48 


20 


2,4 


[50,90[ 


34 


0,34 


40 


0,85 


[90,1 20 [ 


8 


0,08 


30 


0,27 




N=100 


1 







Alors, on represente 1'histogramme pour h, (hauteur des 
rectangles). 
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Histogramme des hi 
*- Polvgones des frequences : 

Partant de 1'histogramme et joignant par des segments de 
droite les milieux des sommets des rectangles, on obtient le 
polygone (des effectifs ou des frequences). 

Exempt e : 

Reprenons l'exemple des notes des £tudiants en 
Iniormatique I, lorsque les classes ont des amplitudes egales : 
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Polugones des frequences 
II est preferable d'ajouter deux classes fictives aux 
extr£mites de la s£rie pour obtenir un poly gone parfait 

Remarque : 

II y a toujours conservation de la surface puisque 1'aire sous 

le polygone est £gale a 1 (en frequence) (voir parties hachur£es sur 
le graphique qui se compensent). 

Exemples : 

Pour l'exemple des salaires annuels des 100 employes d'une 

ent reprise on a : 
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2.4 












/ ^ 
f 






0.S3 


~f 


\ 






ft V? 


A. 

\ 

\ 


\ 





















% 







30 



50 



90 



128 



Remarque : 

En faisant un ajustement graphique du polygene des 
frequences, ce dernier tend vers une courbe continue appelee 
"courbe des frequences". 

2.- Les caracteres qualitatifs : 

a.- Les graphiques en hrvaux d'orgue : 

Ce type de graphique repr£sente en abscisse les differents 
caracteres (xi), de base constante, et en ordonnees la hauteur 
correspondant aux effectifs ou aux frequences. 

Generalement, on a tendance k ordonner les (xi) selon un 
ordre decroissant en partant de I'origine des axes. 

Exemple : 

Les participants au\ jeu\ olympiques selon le continent 
d'origine : 
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n. 

140 

IMS 

200 
St) 



W?" 



fJY'S, 



f.ji. / 



50 *&%~ 



m 




' v - 

m 



6mm 



Xi 


ni 


Afrique 


80 


Amerique 


100 


Asie 


140 


Australie 


30 


Europe 


130 



F 



7y 
.... 



£A 



.- 









m 

*,-■ 






' 



Uo B 



w8o 



'-■/.-■ 



Aril £-js Ame Ah A 



**■: 



OS 



Diagramme en tuyaux d'orgue 

*- Diagramme a secteurs : 

Cest un diagramme visualisant les parts relatives dans des 
secteurs de cercles. Chaque secteur correspond a une modality 
Tangle au centre est £gal au produit de 360° par la frequence f*. 
Exemple : 

Reprenons I'exemple precedent. 

Le nornbre total des participants est de 480. 

on 

• L'Alrique correspond a x360 = 60 

1 480 
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R£gle de trois 



100 

L' Am6rique -» x 360 = 75 

480 

140 
• L'Asie-* x 360 = 105 

480 



480 -> 360' 
80 -tx 



80x360 tn 

x = = 60 

480 



L'Australie 



L'Europe 



30 



480 
130 



x 360 = 22,5 



480 



x 360 = 97,5' 
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Exercices 

Exercice n Q l : 

Pour chacune des distributions statistiques SI et S2 suivantes: 

1) Definir la population statistique, l'unite statistique, le 
caractere(en pr£cisant sa nature (quantitatif ou qualitatif), la 
variable statistique et sa nature (si elle existe), le nombre de 
modalites que pr£sente le caractere. 

2) Construire (pour les distributions a caractere quantitatiO le 
diagramme en baton ou histogramme et courbes cumulatives. 

3) Construire pour les distributions & caractere qualitatif les 
diagrammes & secteurs. 

Tableau SI : 

Repartition des hdtels homologu£s par le commissariat General au 

tourisme au l m Janvier 1968 selon leur categorie : 



Categorie (nombre 
d'etoiles) 


Nombre d'hotels 


1 etoile 


8346 


2 £toi les 


3770 


3 etoiles 


1161 


4_etoiles 


259 


5 £toiles 


48 



ct* 



VW 



:4* 



31 



4ETUUP 



.com 



Statistique Descriptive 



Representation des donnecs 



Tableau S2 : 

Sur un rapport de 50 pages, on a releve le nombre de fautes de 
frappe. On a obtenu le tableau suivant : 



Nombre de fautes 
de frappe 



1 
2 

3 
4 
5 
6 



Nombre de pages 



8 

12 

15 

8 

4 

3 



0UM -X) 



Exercice n°2 : 

Les salaires mensuels en dirhams des 50 employes d'une 
entreprise sont donnes par le tableau suivant : 



Salaires en 

DH 
■ 0-1500 



>^o 



1 8^- 



1500-3000 
3000 - 4500 
4500 - 6000 
6000 - 7500 



Nombre 
d 'employes 



3 
15 
20 
8 
4 



i tc 



1) Calculer: 

a) Tous les types de frequences. 

b) Les centres des classes. 

2) Representer 1'histogramme et le polygone des frequences. 

3) Quel est le pourcentage des employes qui ont un salaire : 
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a) Inferieur a 3000 DH/mois ? O , l£ r loo = 36 ?, 
f ' td b) Supeneur a 4500 DH/ mois ? ** I *-V *f o« «- i-</£ 
P ^ '>>* c) Entre 3000 et 4500 DH/mois ? ° ' w * f ° ° * U ° C ^ 
d) Inferieur a 2800 DH/mois ? [ IS oo, 3 o 00 [—s b , ?6 
Exercice n° 3 : [/5o^'&cC--> « 



La distribution des salaires mensuels dans une entreprise 



est donn£e par le tableau suivant (en Dhs) : 



[ei-i ; ei[ 


ni 


<5000 


12 


[5000 ; 6000[ 


15 


[6000 ; 7000[ 


27 


[7000 ; 8000[ 


33 


[8000 ; 9000[ 


30 


[9000 ; 10000[ 


20 


>10000 


13 






1) Calculer les frequences relatives et les frequences relatives 
cumulees croissantes et d§croissantes. 

2) Quel est le pourcentage des salaries qui gagnent moins de 
7000Dhs/mois? Oi *6 f ho • ^ 6 

3) Quel est le pourcentage des salaries qui gagnent plus de 
8000 Dhs/ rnois? \j £ j v , ye 



L o , '2>3 + 



bS? = C>/</1 
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Caracteristiques de tendance 

centrale 

L-Introdiiction : 

Les caracteristiques des distributions statistiques est un 
outil essentiel de comparaison, se referent a la tendance centrale 
(position), a la dispersion et & la forme (concentration). 
Les caracteristiques de position ou de tendance centrale sont le 
mode, la m£diane et les movennes. 

II.- Le mode (Mo) : 

Le mode est la valeur (M =Xi) la plus frequente de la 
variable, c'est-a-dire celle pour laquelle : 

* La frequence est maximale, ou 

* L'effectif est le plus grand. 

1.- Cas de la variable quantitative discrete : 

Le mode correspond a la valeur x, de la variable ayant la 
frequence ia plus elev£e dans un tableau statistique. 
Exemple : 

Soil la distribution statistique repr£sentant le nombre de 
fr&res et soeurs des £tudiants, 



Xi 


rii 





1 
2 
3 
4 
5 
6 


2 
3 
5 
10 , 




7 
2 
1 






N=30 





Mo=3 puisque l'effectif le plus grand est egal a 10. 
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Graphiquement, le mode correspond £ la valeur x* 
poss£dant le plus haut baton dans un diagramme en batons. 



10- 




2.- Cas de la variable quantitative continue : 

Dans ce cas, les donnees sont groupees en classes et le mode 

est represents par la classe mod ale correspond ante au plus grand 
eftectif. Mais, il faut distinguer deux sous cas, lorsque les 
amplitudes des classes sont £gales et lorsque les amplitudes sont 
differentes. 

Exemple pour le cas des amplitudes egales : 

Soit la serie repr£sentant les notes des etudiants : 



Toutes les a t egaie k 5. 



[tVl, 0,1 


rii 


[0,5{ 
[5,101 


60 
120 
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La classe modale est [10,151, puisqu'elle correspond a 

I'effectif le plus grand. 

le mode correspond : 

-s au centre de la classe modale : 

.. 10 + 15 25 .,„. 
M =— ^— = T = 12,d 

o ou graphiquement, a une valeur donnSe par la mSthode des 
diagonales: ni 



hi = 200 - 



hi.,=120. 




5 10 M„ 15 20 

ei-2 et-i ei e,*i 



Xi 



et on a la formule: 



M =e,-i +t --a 



h ,-> *n M 



(I) 



ou la formule: 



Mo=e>-i + 



2u=h 



i=i 



(h.-hi*i)+(hi-hi-i) 



(H) 
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par application de ( I ), on a : 



M p = 10 + 2 ° 5 = 10 + — = 10 + 0,714 
120 + 20 140 



M =10,714 



Exemple pour le cas des amplitudes differentes : 

Lorsque les amplitudes de classes sont differentes, on 

d£finit la classe modale comme £tant celle du plus grande hauteur 

dans rhistogramme (h ( = — ), (h, represente la frequence 

a i 

moyenne par unit£ d'amplitude). II se peut avoir plusieurs classes 
modales. Dans la classe modale, il faut choisir ou s^Iectionner un 
point comme mode. Ce point se trouve done dans la zone de la 
classe ou il y a le plus d'observations. 



Soit la s6rie statistique : 



U^h^ d'ar^p /;K>J* 



[ei-i, ei[ 


Oi 


a s 


I— i 1 

hi=ni/ai 




[100, 200[ 


15 


100 


0,15 




[200, 400[ 


25 


200 


0,125 




[400, 600[ 


40 


200 


0,2 




[600, 700[ 


35 


100 


n ^ *— 








[700, 100G( 


20 


300 


0,067 





La classe modale est [600, 700[ (et non pas [400, 600[ qui a 
m=40 qui est le plus grand) car [600, 700[ correspond a h, le plus 
elevee. 



On applique la formule : 
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M t »e M + hitl 



h ,-i *h*i 

on a: e,.i=600 ; ei-700 ; 

aplOO 

h M =0,2 et h,*i=0,067 

done M Q = 600 + 0y06/ 1 00 - 625,1 

0,2 + 0,067 

Remarque: 

Le mode ne doit etre retenu que s'il est unique (serie 

unimodale). Lorsque la distribution est multimodal, le mode 
perd toute signification. 

III.- La mediane (Me) : 
1.- Definition: 

La mediane est la valeur de la variable statistique qui 

partage la s£rie statistique en deux parties de total des effectifs 

egaux, en supposant au pr£alable que la distribution soit 

class£e par ordre de valeurs croissantes ou d£croissantes de la 

variable. 

Deux cas se pr^sentent : 
l er ca$ : si le nombre d'observations est impair (2k+l), alors il suffit 
de determiner la mediane qui sera le (k+l)* 1 ™' terme. 
Exemple : 
Soient les notes obtenues par 7 etudiants £ 1'examen : 

+y 10,12,9,13,8,7,11 ^.V->it ^ 

Classons cette serie dans l'ordre croissant : 

7, 8, 9, 10, 11, 12, 13 => Me =10 



Me 
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Puisqu'on a sept termes, la mediane correspond a 10, car il y a 
trois valeurs a gauche de 10 et trois valeurs a sa droite. 



2' 1 ""' cas : si le nombre d'observations est pair 2k, alors la mediane 

est donnee par I'intervalle median de borne inferieure la valeur 

k™ e et de borne sup£rieure la valeur (k+l)* mifc de la s£rie. On prend 

comme mediane la moyenne (la centre de I'intervalle) des bornes 

de I'intervalle median. 

Exemple : 

Soit maintenant la s£rie suivante : 



5,6,7,8,9,10,11,12,13,14 ^' ltU 
il y a dix valeurs, 10 = 2x5=>k = 5* me et k+1 =6^* me , le 5*™ est 9 et 
le 6*™ est 10 

9+10 



M£ = 



= 9,5 £ IN 



Comme on est dans le cas discret et 9,5£ IN, on ne peut pas 
la prendre comme une vraie m£diane. 
2- Methode pratique de recherche de la mediane : 
Exemple 1 : Soit la s£rie statistique suivante : 



Xi 


A) 


BiCC 


1 


1 


1 


3 


2 


3 


5 


7 


10* 


7 


6 


16 


9 


4 


20 




X=20 





N 20 in i 
— a — =10, valeur 

2 2 

existante parmi les 
n^c 



Me=^ = 6 



IQfaW = fc.-m, k+1 



i-n* 1 



11 



13 355555537777779 9 99 

V _ >* '^ -* 
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-4 

<0 



Xi 


n; 


nice 


1 


1 


1 


3 


3 


4 


5 
7 
9 


7 

3 
6 


11* 
14 

20 




M=20 





N 20 1( . 
— = — = 10, valeur 
2 2 

existante parmi les 
nice 



M£ = 5, 



10* nw etll* n « 



13335555555,777999999 

1 ' 



Me= 5 -±1 = 5 



Lorsque la s£rie statistique n'est pas unitaire, c'est-i-dire 
lorsque les effectifs sont differents de 1 (m # 1), alors si 

N = Z n i est 1'effectif total, on characterise la mediane comme ttant 

la valeur qui a la moitte des observations (N/2) inferieures a elle. 

On cherche la valeur N/2 parmi les effectifs cumulus 
croissants, deux cas peuvent se presenter, soit i! existe un n* tel 
que N/2=n il - < soit aucun n» ne verifie N/2=n i( . 

Dans le cas ou il existe un n ir =N/2 / on sera dans la merne 
situation que celle du cas d'un nombre pair d'observations, alors 
les deux positions centrales de la s£rie ordonn€e sont Xi et x,+i, on 

prend, comme mediane la valeur movenne Me = Xi +X ' M 

2 

Dans le cas ou rv * N/2 pour tout les n io alors la valeur x, 

correspondante a I'effectif eumule ou pour la l to fois n u > N/2, 

oocupe I'unique position centrale ou les deux positions centrales. 
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X. + X; 



On prend alors comme mediane Me = Xi ou M6 = ' ' cest-a- 
direque M£ = xi. 



Exemple3:S oit la s£rie statistique suivante : 

MS 

II 
5,6,6,8,9,10,10,10,11,12,13 



qua 



<n l& 



Xi 


ni 


nice 


5 


1 


1 


6 


2 


3 


8 


1 


4 


9 


1 


5 


@) 


3 


& 


11 


1 


9 


12 


1 


10 


13 


1 


11 



N=ll=>N/2=5,5 
n'existe pas parmi les 
njcc 

ilest depass£pour la 
l te fois en 8 

=> io = Me 



N=n 



3,- Cas d'une variable continue : 

Dans ce cas, les valeurs sont regroupees en classes. La 

mediane se calcule d'abord par determination de la classe 
mediane [e,-i, e*] qui correspond a la valeur de ni,- ■ N/2 ou & la 
l' r " valeur des n* qui depasse N/2 clans le cas ou tous les n IC sont 
differentsdeN/2. 

Exemple 1 : 

Soit la serie statistique suivante : 
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3 .6 



[ei-l, ei[ 


ni 


nice 


[0,1 0[ 


48 


48 


[10, 20[ 


52 


100* 


[20, 30[ 


60 


160 


[30, 40[ 


40 


200 




N=200 





N/2 - 200/2 =100, cette valeur existe exactement parmi Ies n ic 

=z la classe mediane (c'est-d-dire 1'intervalle qui contient la 
m&iiane) est [10, Wjrfeb ft] el on prend Me= e* 

=20. 

Exemple 2 : ^ 

Les salaires annuels des employes d'une entreprise (en '■ 
milliers de DH) sont distribues comme suit: Iti 



[ei-l, ei[ 


ni 


nice 


[40, 50( 


12 


12 


[50,60[ 


14 


26 


[60, 70[ 


20 


<J6 1 


[70, 80[ 


8? 


76* 


[80, 90[ 


14 


90 


[90,1001 


10 


100 




N=100 





Me >s 



H fc _JZ-\ 



^ 



N/2 - 1 00/2 =50, cette valeur n' exists pas parmi les ruce 
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la classe m£diane est la classe qui correspond a rUc qui d£passe 
le premier la valeur 50 c'est-a-dire [70, 80]=[e i .i / e*] et ensuite, on 
applique la for mule : 



N 
Me «e M + -^— - -a 



\'C /-. 



n ; 



Me = 70 + -^-^10 = 7133e [70,80] 
30 



Interpretation : 

On a ; N/2=50 et M6 = 71,33 . 10 3 DH = 71 330 DH 

II y a 50 employes qui ont un salaire inferieur k 71330 DH et 
50 autres qui ont un salaire sup^rieur & 71330 DH. 

4.* Methode graphique de determination de la mediane : 

On trace la courbe des frequences (ou des effectifs) 

cumulees croissantes et la courbe des frequences (ou des effectifs) 
cumutees decroissantes sur le mgme rep6re. La projection du point 
d'intersection de ces deux courbes sur I'axe des abscisses donne la 
valeur de la mediane. 

Exemple : 

Soit la distribution de ['exemple precedent ; 



[en, ei[ 


n; 


met 


nii-1 


[40,tgj 


12 


U 


100 


[@,60[ 


14 


26 


® 


[60, 70[ 


20 


46 


74 


[70, 80[ 


30 


76 


54 
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[80, 90[ 
[90,1 00[ 


14 
10 


90 
100 


24 
10 




N=100 







Traijons la courbe ties inct et des njci sur le m£me repSre 
nic 

100 



SO 




t r 



on voit que la mediane est presque 6gale a la valeur trouvee 
alg£briquernent 71,33 

IV." Les movennes : 

Generalement, il y a quatre types de movennes : 
arithmetique, geometrique, harmoniqueet quadratique. 
I.- Movenne arithmetique ( \ ) : 

La moyenne arithmetique d'une variable statistique est 
egale a la somme des valeurs de la variable ponderees par les 
frequences relatives. 
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* = S f,X, 



i = 1 



done 



k n 1 k 
x = V— l -x- = — Vrvx. 

afN 1 Mft f - 




d'ou 



Fxemple : 

Soient les notes d'un groupe de 30 etudiants 



Xi 


n; 


HjXj 


f, 


fi Xi 


7 


4 


28 


0,133 


0,931 


8 


5 


40 


0,167 


1,336 


9 


6 


54 


0,2 


1,8 


13 


7 


91 


0,233 


3,029 


14 


6 


84 


0,2 


2,8 


15 


2 


30 


0,067 


1,005 


Total 


N=30 


327 


»-i 


10,901 



La note moyenne de ce groupe est : 

_ i i, | 

x ■ TTh n i x , = — -327 = 10,9 sur 20 
w i=i 30 

x = X f i x . =10,901 *10 rf 9 

i ■ I 

*- Variable statistique continue : 

Pour le calcul de la moyenne aritl imetique dans le eas de la 
variable statistique continue, il faut proceder par la formule 
suivante : 



- 1 \r 
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ou Q represente le centre des classes. 
Exemple : 

L'age des salaries d'une entreprise est distribue comme 
suit: 



[e,-!, es[ 


ni 


Ci 


n;Ci 


[10, 20[ 


2 


15 


30 


[20, 30[ 


15 


25 


375 


[30,40[ 


33 


35 


1155 


[40, 50[ 


13 


45 


585 


-C^kisde^) 


7 


©? 


385 


Total 


N=70 




2530 



Lorsque la borne n'est pas definie, il faut la d£finir soil par le "bon 
sens" soit par extrapolation des donnees. Ici, on peut dire que : 

• L'&ge de la retraite est de 60 ans, done la classe "plus de 50 
ans" est ; [50, 60[, 

• On a des classes d'amplitude 10, done la derntere sera de 
[50, 60[. 

- 1 NT 1 

Ainsi X = —2, ri 1 C 1 = — .2530=36.14 

IN i= i 7U 

36,14 est l'age moyen des 70 salaries de 1'entreprise. 
*- Calcul de x par changement d'orieine : 

Lorsque les valeurs xi et ni sont trop grandes et que le 
calcul devient volumineux, il est preferable de proc£der a un 
changement d'origine par la transformation suivante : 
Si c- est une origine quelconque, soit le changement x'j^x, -c io , 

alors la moyenne sera x' = x-c v d'oD la moyen ne arithmetique 

recherchee sera x = x 1 4- c. 
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Exemple : 

Soit l a serie statisticjue sui vante : 



[e,-i, ei[ 


Hi 


Ci 


Ci - C3=C'i 


n f c'i 


[400, 500 [ 


8 


450 


-200 


-1600 


[500, 600 [ 


10 


550 


-100 


-1000 


[600,700[ 


12 


<§D 








[700, 800[ 


50 


750 


100 


5000 


[800, 900[ 


20 


850 


200 


4000 




N=100 






6400 



Qo = C3 = 650 ; le choix de cette valeur s'est fait par le choix de la 
valeur centrale des observations. 



or 



x = x-c 3 => x = x + c 3 

5?« x6400 = 64 done 

100 



x = 64 + 650 = 714 



*- Propriety de la movenne arithmetique : 

1) La somrne des hearts a la moyenne arithmetique est 

nulle:tn l (x 1 -x) = 
En effet : 

*< _ i _ s _ _ 

X n i( x i - x ) = X n i x i ~ x X n > =Nx-xN = 

2) La somme des carries des hearts a x est minimale, e'est- 

k _ 

i-dire : ^n^x^ -x) 2 est minimale. 
En effet : 

k 

soit la fonction Y(y) = £M X . ~ >') 2 

M 

on va d£montrer que Y est de derivte premiere nuJle en yo=xet de 
deriv£e secon.de positive (concavite vers le haut) 
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>y 



ona:Y(y)=rX n i( x ' -2x,y + y 2 ) 

k k 



- E n . x i - 2 yZ n i x » + y'Z n * 



i=i 



i="l 



i=l 



<JY k k k k 

— - «2£fl|X| + 2y£n i = « y^n, = S n i x i 



i«^l 



i-1 



i=l 1*1 

c> y = 77Z n i x «= x 



done Y admet un extremum (optimum) en x . 



dy 2 £ 

d'ou Y admet un minimum en x (concavity vers le haut). 

2- Movenne geometrique G : 

Elle est egale k la racine N iiMlw du produit des k valeurs 
d'une serie statistique. 

a- Cas d'une serie simple : 

Tous ses N valeurs sont d'effectifs egaux & 1, alors : 
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G= ^/x, ,x : x N = (x t .x ; 

G = 



*n>* 



ft*. 

f N 



1 I - 

lo 8 G= T7 lo 8 3 [ x 



done logG= — £logx, 

d'oti on a suppose que V i=l, . . ., N 



x,>0 



b- Cas d'une serie ponderee : 

Ses valeursxi, ,Xk ont des effectifs differents ni, , nu 

respect ivement. 



\« 



G-$x?x? x- m It xT -n 



i=l 



n jl a 



N 



i=l 



N = ni+n2+ +nk 



G-nx: 



i, i 



f K 



log G = log H xH = X log* ? = Z f . lo S x i 



< i = l 



i=l 



i-1 



ici, aussi, on a suppose que xt>0 Vi=l, ...,k 

Remarque : 

La movenne geom£trique est utilisee pour le calcul des taux 
d'accroissernents moyens, des moyennes de coefficients 
multiplicateurs-.-cest-^-dire, dans les cas ou la variable represente 
des variations cumulatives. 
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Exempt e 1 : 

Calculer la moyenne g£om£trique de la distribution de 

frequence suivante : 



Xi 


nj 


1 

2 
3 


2 ■ 
3 




N-10 



On peut utiliser des logarithmes nep&iens ou dedmaux 
sans changer le resultat de G» 

Alors utilisons les logarithmes dlcimaux, on aura : 



Xi 


ni 


logXi 


ni log xi 


1 

2 
3 


2 
5 
3 




0,301 
0,4771 



1,505 
1,4313 


Total 


N=,|0 




2,9363 



Alors 



1 k 

,0 s G = TrZ n i |o s x i 

™ 1=1 

= — 29363 = 0,29363 

10 

G = 10 O,29V,, = 1(97 



Exemple 2 : 

Le chiffre d'affaire d'un projet a produit les augmentations 
annuelles suivantes : 
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Annee 


Augmentation en % 


l^ re ann£e 
2* me annte 
3ome annee 
4 ,,nu ' ann£e 
5*°" ann£e 
6* mp ann£e 


4% 

O 'o 

6% 
6% 

5% 
5% 



L'augmentation moyenne annuelle est une moyenne 
geom£trique 



G= VO04)ab6)-(l,05) : 

G = 1,05331 
soit un taux de croissance de 5,331 % approximativement. 

En effet ; si C G est le chiffre d'affaire au d£but de la I** annee, a la 

fin de cette annee il devient : Co+C- -£- =C ( 1+0,04) = 1,04 C = 

100 

Ci y ce chiffre G devient a la fin de la 2* me ann6e G + Ci-— — =1^06 

100 

Ci = C2 et ainsi de suite, a la fin de la 6 eme ann£e, le Co devient 
Cf = 1,05 . 1,05 . 1,06 . 1,06 . 1,06 . 1,04 G> 



-^- = (1,05) 2 (l,06)\l,04=G h 



ainsi, ['augmentation 
eometrique 

G 

G 

soit un taux de 5,331 % . 



moyenne annuelle est la moyenne 

^/(l,04)(l,()6)- , (l.05) 3 
1,05331 



51 



-€ETUUP 



.com 



Statisticme Descriptive 



Caracteristiques de tendance centrale 



3.- Generalisation de la movenne : 

L' expression de la movenne peut se generaliser de 
plusieurs mani&res, une d'entre elles est ce que Ton appelle la 
movenne d'ordre r, notee M r , d£finie par : 



k 



! 



Ainsi, la movenne arithm£tique est un cas particulier avec r =1, 
c'est-a-direMi=x. 

On peut montrer que G = Mo par passage a la limite et par des 
th§or£mes pratiques de derivation des fonctions. 

I 

G - M = Iim M E = limf Y £c?Y 

4.» Movenne harmonique H : 

On d£finit la moyenne harmonique comme la moyenne 
gen£ralis£e d'ordre -1. Elle se note H 



-i 



-i 









-1 



k n ^ 




Cest la formule du cas d'une s£rie ponder£e 
*- Cas d'une s£rie simple : 
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Remarques : 

La moyenne harmonique se calcuie pour des valeurs de la 
variable X non nulles et elle n'a de signification concrete que si 

1' inverse — de la valeur x* a un sens. 

Elle est utilisee pour le calcul des moyennes de 
pourcentages, de ratios et de rapports, de meme que pour l'etude 
du pouvoir d' achat (inverse du mouvement g£n£ral des prix), etc. 

Exemple : 

Une imprimerie a imprime 500 livres & la vitesse de 400 
livres par heure et elle a imprime 1000 livres identiques a la vitesse 
de 350 livres par heure. On veut determiner la vitesse moyenne 
pour imprimer les 1500 livres. 

< * '1300 1500 

Alors c est H = 



Hi Hi ?9° 100 ° 
x, x 2 400 350 

1500 _- .. ,, 

= = 365 livres/ heure en 

1,25 + 2,86 

moyenne. 

5.* Moyenne quadratique Q : 

La moyenne generalises d'ordre r =2 s'appelle la moyenne 

quadratique. 

i 

k n 



Q-K.-|Z«tf .^,? 



*=l J 




4EI1HJP 

.com 



StatistJQue Descriptive 



Caracteristiques de tendance centrale 



y - Cas d'une s£rie simple : 



Q=JX>:*; 



m 



Exemple : 

Calculons Q de ia s£rie suivante : 



Xi 


n; 


x? 


mxj 


2 


7 


4 


28 


4 


10 


16 


160 


5 


20 


25 


500 


7 


30 


49 


1470 


9 


15 


81 


1215 


10 


10 


100 


1000 


11 


8 


121 


968 




N=100 




5341 



5341 



Q % E£L.J$4l«7Jl 



I0O 



Remarque : 

On peut montrer que les moyennes g£n£ralisees d'ordre r 
d'une meme serie statistique verifient : 



p<q 



alors 



M r <M, 



ainsi 



M.i<M..<M[<M2 



c'esl-a-dire 



H<G<x<Q 
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Exercices 
Exercice n° 1 : 

Au cours d'une enquete dans une entreprise, on a releve les 20 
salaires suivants: 1800, 2200, 2000 , 3800, 3500, 1700, 2600, 2800, 
2200, 2600, 2400, 2300, 2100, 2400, 3500, 2600, 2400, 2100, 1800, 
2600. 

1) Calculer \e salaire moyen x . 

2) Regrouper les 20 salaires en tableau, avec les classes ci-dessous: 
[1500 ; 2000[ ; [2000; 2500[ ; [2300 ; 3000 [ ; [3000 ; 3500 [ ; 

[3500 ; 4000 [ 

Tracer 1'histogramme correspondant en precisant la hauteur de 
chaque classe. A quelle valeur .*, du salaire moyen conduit ce 
classement. 

3) Si Ton regroupe les deux dernieres classes pr&ciser la 
deformation subie par 1'histogramme precedent. 

A quelle valeur x : du salaire moyen conduit ce nouveau 
classement ? Conclusion? 



Exercice n ° 2 : 

La repartition de 100 exploitations agricoles selon leur 

superficie, exprimee en hectares (ha), est donnee par le tableau 

suivant : 



Superficies (en ha) 


Nombre 


comprises entre 


d "exploitations p", 


10-20 


10 


20-30 


15 


30-40 


25 


rio^To 


30 


50 - 60 


10 


60 - 70 


r> 


70 - 80 


4 



4 




± 


k 


Uc 


ncc 


e,1 


o,1 


l< 


OjK 


o,2t a. 




o J St 


Va 


*'\1 


C,ot 


0,°* 


c,«p 


4 7i 


1 







) Calculer Coils les types de frequences. 
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2) Determiner le mode et la mediane graphiquement ei par le calcul. 
Donner leurs interpretations. 

3) Quel est le pourcentage des exploitations aericoles qui ont une 
superficie : 

a) lnferieure a 30 ha ? 

b) Superieure a 40 ha ? 

c ) Comprise entre 30 el 40 ha ? 

d) lnferieure & 47 ha? 

Exereicen3 : 

Sur un rapport de 50 pages dactylographies, on a releve le 

nombre de fautes de frappe par page. On a obtenu le tableau 
suivant : 



Nombre de fautes: 


Effectifs 


Xi 


ni 


1 


8 


2 


12 


3 


15 


4 


8 


5 


4 


6 


3 



1) Que represente Ini 

2) Calculer Zxini .En d£duire le nombre moyen de fautes par 
page. 

Exereice n"4 : 

On se don ne la serie statistique suivante :1 , 2 , 5,7, 10, 13. En 

utilisant un coefficient de ponderation identique calculer les 
movennes arithmetique, geometrique, harmonique et 
quadratique. 
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Exercice n J 5 : 

La distribution, en pourcentage, de 50 employes d'une 

entreprise selon leurs salaires mensuels (en dirhams) est donnee 
par le tableau suivant : 



Salaires en DH 


Pourcentages 


compris ertlre 


des employes 


- 1500 


6 % 


1500 - 3000 


30 % 


3000 - 4500 


40 % 


4500 - 6000 


16% 


6000 - 7500 


8 % 



1) Calculer les frequences relatives et deduire les differents 
effectifs. 

2) Calculer les frequences relatives cumulees decroissantes et 
repr£senter leur courbe. 

3) Quel est le salaire le plus frequent ? 

4) Quel est le salaire median ? 

5) Determiner le salaire moyen par la m£thode directe et par 
un changement d'origine convenable. 

Exercice ir 6 : 

Une entreprise prodtlit un certain bien. Elle dispose de 3 

usines A, B et C dont les rendements sont 20 unites par jour pour 
A, 32 pour Bet 40 pour C. 

L'usine A a produit 8000 unites, I'usine B a produit 9600 et C a 
prod u it 12000, pendant une periode determinee. 
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Quel est le rendement moyen de cette entreprise pendant cette 
periode ? (Justifier le choix de la m^thode utilis^e). 

Exercice n c 7 : 

La dur6e de 1'unite t£l£phonique de base entre 2 villes A et B est 

de 20 secondes; cette unite est facturte 50 centimes par 

1 'ad ministra Hon. 

Une dur£e inferieure k 20secondes g£n£re 1 unite et coGte done 50 

centimes. 

Une dur£e comprise entre [20s ; 40s [ g£n£re 2 unites et coflte 100 

centimes et ainsi de suite. 

Le tableau suivant repr£sente la distribution de la dur£e X (en 

secondes) et du nombre d'unites Y correspondantes, des 

communications tel£phoniques entre les 2 villes A et 

B. 



Dur£e X (en 


Frequence fi 


Nombre 


seconde) 


(en %) 


d'unitesYi 


[120; 140[ 


2 


7 


[140;160[ 


6 


8 


[160;180[ 


12 


9 


[180;200[ 


20 


10 


[200 ; 220[ 


18 


11 


[220 ; 240[ 


14 


12 


[240; 260( 


10 


13 


[260 ; 2S0[ 


7 


14 
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(280 ; 3O0[ 


5 


15 


[300 ; 320[ 


3 


16 


(320 ; 340[ 


2 


17 


(340 ; 360[ 


1 


18 



1) Quelle est la nature statistique de la variable X? M§me question 
pour Y. 

2) Determiner le coOt moyen d'une communication entre A et B . 

3) Trouver la relation entre le centre ci de la i* mp classe et la valeur 
yide Yassoctee 

En supposant que la distribution des dur£es est uni forme d 
1'interieur des classes, calculer la dur6e moyenne d'une 
communication. 

4) [-'administration envisage de faire passer la dur£e de 
l'impulsion de base de 20s A 40 secondes. Une £tude pr^alable a 
montre que ni le nombre ni la distribution de la dur£e des 
communications ne seraient aft'ectes par une telle mesure. 
Calculer la baisse des recettes engendr£e par cette decision. 
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Chapitre 3 : 



Caracteristiques de dispersion 



L- Introduction : 

Les caracteristiques de tendance centrale vues 
pr&edernment ne nous perrnettent pas de faire la difference entre 
deux series statistiques. En effet, deux series peuvent avoir la 
m^me moyenne arithm^tique et la m£rne m£diane sans qu'elles 
soient identiques. On introduit, alors, autres caracteristiques dites 
de dispersion qui estirnent dans quelle mesure les observations 
s'£cartent les unes des autres ou de leur valeur centrale. 
Les caracteristiques de dispersion sont : 



1'Etendue, 
les Quantiles, 
1'Ecart absolu moyen, 
la variance et l'Ecart-type 
le coefficient de variation, 
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IL- I/Etendue : 

1.- Definition : 

L'Etendue ou I'lntervalle de Variation est la difference en tre la 

valeu r la plus faible et la va leur la plus 6lev6e d'une s£rie 

statistique. 

2.- Exemplc : 

On consid^re les salaires des employes de deux entreprises A et B : 

Pour A; 700, 720, 750, 800, 900, 1000, 1150 

Pour B : 20, 100, 200, 800, 1300, 1600, 2000. 

On a X*=X*=860et M&-A4&-800 

Meme si les moyennes arithmetiques et les medianes de ces deux 

series sont identiques, on ne peut conciurequ'elles sont identiques 

car 1'information sur le groupernent/Tecart (la dispersion) des 

£l£ments des series n'est pas disponible. 

Calculons Tetendue pour ces deux entreprises : 

Pour A, Tetendue est de 450=1150-700 

Pour B, Tetendue est de ] 980=2000-20 

La dispersion est done plus forte pour B que pour A. 

3.- Exemple : 

Sur 1000 employes d'une entreprise, Tetendue de I'age est 
dell ans (49ans -38 ans), il suffitqu'un jeune employe (sur 1000) 
de 18 ans soit embouche pour que Tetendue passe a 31 ans (49 ans 
- 18 ans) ! On voit done que Tetendue est une maniere tr£s 
simpliste de mesurer la dispersion. 
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III,- Les Quantiles : 
1»- Definition: 

Les quantiles sont les valeurs de la variable statistique qui 
partagent la distribution en "n" parties composes du meme 

effectif" — ". 
n 

Exemple : 

La m£diane est un quantile qui partage la distribution en 

N 
"2 parties composes du m^me effectif " — ". 

Re marques : 

- Les quantiles en eux-m£mes sont des caraetcristiques de 
position (non centrale), tandis que 1'intervalle mesurant l'£cart 
entre deux quantiles et une caracteristique de dispersion. 

- Pour la determination des quantiles, on suppose que les 
valeurs de la serie statistique sont classees dans un ordre 
croissant ou d£croissant. 

2.- Les quartiles : 

a.- Definition : 

Les quartiles sont les trois valeurs que Ton note Qi, Q2, Qi 

de la variable statistique qui partagent la distribution en "4 

N 
parties eomposees du m£me effectif " — ". 



" \-- 
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4 25% >< 75% > 



1 r 



< N_— -><— N. >< H— -»< N_ 

4 4 4 4 

^ Q> ^ Q 2 =Me <£ 50% > 

50% 

* 75% > Ql < 25% — 



*L 



Remarque : x x 

.- P M 

II v a N— observations <* gauche (inferieurs) de Qi, i=l, 2, 3 
J \ 4 

b.- L'intervalle interquartile : 

Cest la difference entre Qs et Qi. Soit Qs - Qi ; il conhent 
50% des valeurs de la variable pr£sentes par la moitte centrale des 
effectifs observes. Cet intervalle elimine ['influence des valeurs 
extremes. 



c.-La derivation ciuartile ou le semi-interquartile est egale & 

Q3-Q1 

2 

d.-l/ecart interquartile relatif : 

Pour comparer la dispersion entre deux series statistiques 
ayant des unites differentes ou dont I'ordre de grandeur n'est pas 
le meme, on utilise I'ecart interquartile relatif donnee par : 

Q,-Q. 
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3,* Les deciles : 
Definition : 

Les deciles sont les 9 valeurs Dj, D2, . .., Ds et D9 de la 
variable statistique qui partagent la distribution en "10" parties 

composes du m£me effectif " — " et qui ont, done, 
N — observations inferieures £ chaque D, , i=l, 2,..., 9. 



< 50% 

< 20% " 



Q 2 =Me=D 5 m% 

1 — 1 — £ " — ■ 1 — 1 

Di D 2 D . 5; 

N ^ 

10 10 



4.- Les percentiles : 
»- Definition : 

Les percentiles sont les 99 valeurs Pi, P 2 , ..., P 9 s et P99 de la 
variable statistique qui partagent la distribution en "100" parties 

composes du mfime effectif »—» ay ant, done, N 

luvJ 

——observations inferieures a chaque Pi, i=l, 2, ..., 99. 

1 uu 



M 
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50% 



7% 



■*- 



1% 



P5o=Q 2 =Me=D 5 



w N 



100 100 

*- Remarque: 

Le calcul des quantiles est pareil h celui de la rn£diane, en 

changeant la frequence — (nombre d'observations inferieures a la 

mediane) parN — (nombre d'observations inferieures au quantile 

n 

d'ordre — chercW). 
n 

*- Exemplel (cas du variable discr ete "ponderee") : 

Calculer ies percentiles 55 et 75 de la serie statistique 

suivante ; 
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Xi 


ni 


riicf 


3 


3 


3 


4 


7 


10 


8 


30 


40 


10 


20 


60«- 


11 


15 


->75 


20 


25 


100 



A« 



N=100 



1)N— =100— =55 
100 100 

On cherche ce 55 entre les riiCJ 

=> il n'existe pas exactement mais 60 

est la 1*"" valeur qui depasse ce 55 

alors Pss = 10 






2> N Too =75/ dans ce cas oui ^ p?5 = ^T^ =15 ' 5 

*- Exemple2 (cas du variable continue) : 

Calculons les deciles troisteme et septteme de la 
distribution statistique suivante : 



[ei-i, e ( [ 


ni 


nic| 


[0, 10[ 


4 


4 


[10, 30[ 


8 


12* 


[30, 35[ 


13 


25 


[35, 80[ 


S 


30" 


[80,1001 


3 


33 


[100, 150[ 


7 


40 1 




N=40 





N-— =12 
10 

cette valeur apparait dans le 

tableau*, alors on prend D? = e2 

e'est-a-dire Ds = 30 
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D 7 = ? 

N— =28 
10 

Cette valeur ne se trouve pas exactement dans le tableau, 

mais 30** est la l ere valeur qui la depasse, on applique alors la 

formule : 



D 7 = es-i + 



N--n,,c 



10 



a 



n 



Qui vient de la formule g£n£rale : 



N--n, : c 
Quantile = en + — - a 



n 



r\ 




2R — 2S 1 

D 7 = 35+ — — (80-35) = 35 + --45 = 35 + 27 







5.- Boite de Tuckey. Diagramme de Box & Wiskers : 

Consid£rons le diagramme en boite ci-dessous, qui est la version 
la plus simple de la boite de Tuckey, appliqu€e h la variable X. 
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O 



A'mui Ql Q2 Q3 Xmax 

On distingue sur ce schema la « boite de Tuckey » qui est le 
rectangle construit sur le premier quartile Qi et le troisteme Q3. 



IV.- L'Ecart absolu moyen : 

L'£cart absolu nioven est la somme des valeurs absolues 
des hearts I la moyenne arithmetique, multiplies par les 
frequences relatives. 



e= Zl x : * x l f . 

1^1 



ou 







UK, 



s.«.-» 



r 
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Remarque : 

Si l'ecart absolu moyen d'une s£rie statistique est grand 
(resp. p£tit), on dit que la serie est tr£s dispersee (resp. peu 
dispersee). 

V.- La variance et l'£carMvpe : 

• La variance d'une variable statistique X que Ton note Var(X) 
est la moyenne arithmetique des carres des ecarts des valeurs de 
la variable a leur moyenne arithmetique ecarts des valeurs de la 
variable a leur moyenne arithmetique. 

VarW-^;£n J «x 1 -J0 1 »£oc l -S)*$ 

L'£cart-type d'une variable statistique X que Ton note Ox est 
la racine carree de la variance de X. 



ax=V^W=^tn i (x i -x) 2 

ax est done la moyenne quadratique des ecarts & la moyenne 

arithmetique. 

*- Simplification des calculs de la variance : 

Pour simplifier le calcul de la variance, on peut utiliser un 
changement d'origine ou d£ve!opper la formule de la fagon 
suivante : 

Var(X) =2>i -x)^i s i(X? -2x Xj +x : )f, 

|«1 1*1 

Var(X) =ixff 1 -2xXx,f, + x ! Xf, 

= X =1 
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Var(X) = 



f k 



f v 

-2x 2 +x- = 



u*i 



Z>& 



xi = l 



-x 2 



Var(X) = 



/- k > 




f 


z*ft 


-x" = 




V M J 




k. 






-x 2 



Le dit changement d'origine affecte la variance de la forme 
suivante : 

x'««Xi— x, =>x',4-x, = X,=>x'+x, =x 



M 

k 



k 

L»1 



Var(X) =X(x, -x)H-£((xf +x,J-(r+X, Ff, 



= I(x, 2 -x 2 ) 2 f i =Var(X l ) 



i-1 



Done le changement d'origine n'affecte pas la valeur de la 

variance. 

Exemple : 

Calculer la variance, en utilisant les simplifications des 
calculs, pour la s£rie suivante : 



[ei-i, e,[ 


rii 


C; 


c 2 =ci-25 


nicf 


nic'f 


[0. 10[ 


1 


5 


-20 


-20 


400 


[10, 20[ 


*> 


15 


-10 


-20 


200 


[20. 30[ 


3 


25 











[30, 40[ 


4 


35 


10 


40 


400 




N=10 









1000 
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On a pris C, ■ 25 ■ c 3 



Var(X 



')'^t^ 



Nfe 



\ — -1000 -f— 1 =100 



io no 

Done Var<X) = 100 

et Gx= VVar(X)=VlO0=10 

*- Variance intraserie et variance interserie : 

Supposons que Ton peut considerer deux sous-series d'une 
serie statistique. Alors il est possible de determiner la variance 
globale de la s^rie si Ton connait les variances de ses deux sous- 
series. 

On a: 
La moyenne de la s^rie m£re est la moyenne ponder£e des 
moyennes des deux sous-series : 

X=^-(N 1 x ]+ N 2 x 2 ) 

avec N est l'effectif total de la serie mere 

N- et x { sont l'effectif total et la moyenne arithmetique d'une 

sous-serie. 

La variance de la s£rie total est egale & la moyenne des variances 
des deux sous-series augmentee de la variance des moyennes des 
deux sous-series. 
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1 



Var(X)=-[N 1 Var(X I ) + N : Var(X : )] + ±[N 1 (x 1 -x) 2 +N 2 (x 2 -x) 2 ] 



N 



V 



Moyenne des variances 



Var(X.) 
II 
Variance intraserie 



Variances des moyennes 



Var(X,) 
II 
Variance interserie 



Remarque : 

• La variance intraserie est la variance que I'on obtiendrait si 
les deux sous-series avaient la meme moyenne (egale k la 
moyenne globalex, = x 2 = x). 

• La variance interserie est la variance que l'on obtiendrait si 
chaque variable de chaque sous-s6rie etait £gai a sa 
moyenne (sous-series homog£nes). 

Exemple : 

Soit la serie globale des salaires du personnel d'une soctete 
mere X composed de deux filiates Xi et X2. 





fil 


ale X, 1 


filiale X 2 | 


Societe mere 






i-ffectif 

n, 


saluire x. 


effectif 

n, 


solaire x, 


effectif 


salaire x t 




Cadres 


10 


80 


5 


71) 


15 


76,67 




Techniciens 


20 


1ft 


10 


16 


30 


1733 




Ouvriers 


30 


10 


100 


s 


136 


8,46 






Nl = 
60 


X,=24>33 


\2 = 
115 


X. =11.39 


N T = 
175 


X =15,83 
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Calculons la variance globale, variance inlrafiliale et 

variance interfiliale. 
Variance globale : 



Var(X) = 



'l k 



XT ^— ' 



_J_ 

_ 175 

Var(X) =359 
Variance intrafiliale : 



-X 



((15 x 76,67 2 ) + (30 x 17,33 2 ) + (130 x 8,46 2 )) - (15,83) : 



Var(X , ) = -J-[N , Var(X , ) + N , Var(X , )] 



avec 



Var(X,) = 



f n k \ 

— 5>,x? 



-x 2 



Var(X, ) = — {(lOx 80 2 )+ (20xl8 : )+ (30x 10 2 ))- 24,33 2 = 632,72 
60 



f 



Var(X 2 ) = 



.T *— ' ' ' 



,N 2 fr 



Var(X 2 ) = ^ : ((5x7O 2 )+(l0xl6-)+(l00x8 : ))-ll,39 2 =161,23 

ainsi Var(X \ ) = -\ [(60 x 632,72 )+ (1 15 x 161.23)]= 322 

i /<d 

Variance interfiliale : 

Var(X,) = — [n,(Xi-X) 2 +N,(X:-X) 2 ] 

Var(X, ) = ■£- [60 (24,33 - 1 5,83) 2 + 1 1 5(11,39 - 15,83) 2 ] 
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Var(X,)~37 



Conclusion : 



Var(X)=Var(Xi)+Var(X,) 
359 = 322 + 37 

VI.- Le coefficient de variation : 

II est £gal au rapport de I'£cart-type a la moyenne et il est 
presents sous forme de nombre abstrait sans dimension et 
independant des unites de mesure. 




Le coefficient de variation permet de donner une id£e sur 
l'amplitude de variation en comparant I'ecart-type et la moyenne. 
Ce rapport est g£neralement exprim£ en pourcentage. 



c =ax,» 



Plus le coefficient de variation est petit plus la s£rie est homog£ne. 
D'une mantere g£n£rale, la population etudtee est consid£ree 
homogene lorsque le Cv < 30%. 
Exemple : 

Calculer G pour 1'exemple des deux filiales Xi et X2 
precedents : 

Cvf v n _q(X')_12,7 ■, 1? 

Lv(X,)_ x, '1T39- 1 ' 12 
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c**f4Bfr«- 



la dispersion relative des salaires et presque identique dans 
les deux etablissements. 



Exercices 
Exercicen°l : 

Les salaires annuels {en itf DH) de 100 ouvriers d'une entreprise 
sont distribues de la maniere suivante : 



Salaires (en 10 3 DH) 


Nombres des 


compris entre 


ouvriers 


J 25 et 26Q 
26 et 2ST 


13 | 


15 


28 et 30 


21 


[30eT32f 


19 


32 et 34 


15 


34 et 35 


10 


35 et 36 


7 




-J 1c. 



304-^t - *>\ 



1 ) Cakuler les frequences relatives et les effectifs cumules croissants. 

2) Determiner le nombre des ouvriers qui ont un salaire annuel inferieur 
a 32000 DH. 

3) Determiner le pourcentage des ouvriers qui gagnent moins que 28350 
DH par an. 

4) Determiner le salaire annuel le plus frequent graphiqucment et par le 
calcul . 

5) Determiner la medianc de eette distribution et interpreter le rcsultat. 

6) Calculer le salaire annuel moyen de ces ouvriers. 
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7) Calculer les quartiles Qi et Qs de cette distribution. 

8) Determiner sa variance et son ecart-type. 
Exercice n°2: 

Vne etude sur l'epargne locale aupr£s des agences relevant 
des delegations provinciates de la Poste a permis d'etablir les 
caracteristiques des versements & la caisse d'epargne, au cours 
d'une journ£e type, dans la region Tanger-Tetouan. Ces 
caracteristiques sont resumees dans le tableau ci-apr&s : 



Etat de versement a la 
Caisse d'epargne 


Tanger 


Tetouan 


Nombre de 
versements 


35 


30 


Versetnents moyens 


2200 


2400 


Variances des 
versements 


3025 


3600 



1) Donner le versement moyen pour l'ensemble de la region 
Tanger-Tetouan. 

2) Calculer la variance intra-ville et la variance inter-ville des 
versements. 

Quelle est la variance regionale des versements ? 

3) Comparer la dispersion des versements £ Tanger et 
Tetouan, en utilisant le coefficient de variation. 
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Exercice n°3 : fi 

Une enquete sur la mobilite a donn£ la repartition suivante 
{exprim^e en %) pour une population d'individus domiciles a la 
region Tanger-T£touan, selon la distance entre le domicile et le 
lieu de travail (distance exprirnee en kilometres) : 



Distance 


Tetouanais 


Tangerois 


(en km) 


(en %) 


(en %) 


[0,21 


5.7 


3.1 


[2,6[ 


12.0 


7.7 


[6, 10[ 


6.3 


6.8 


[10,151 


8.1 


4.6 


[15, 25[ 


11.0 


6.8 


[25, 50[ 


11.2 


5.4 


[50, 60[ 


7.8 


3.5 



1. Cakulez la distance moyenne parcourue par un travailleur 
tetouanais et par un tang£rois. 

2. Determinez la variance et r&art-type des distances 
parcourues par un travailleur tetouanais et par un 
tanggrois. 

3. Calculer le coefficient de variation pour les distances 
parcourues par un travailleur tetouanais et pour celles 
parcourue par un tangerois. Conclure. 
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Exercice n°4 : ** 

^ttvtvffvttmftmvfiwiwfnfiffti* 

Les salaires annuels (en 1000 DH) des employes d'une entreprise 
compos£e de deux filiates X et Y sont reparties selon le tableau 
suivant : 



Salaires en 

1000 DH 

compris entre 


Nombre d 'employes 
de la filial? X 


Nombre d'employes 
de la filiate Y 


1 Oct 20 
20 ft 30 
30et40 
40 et 50 


5 
10 
13 
4 


4 
12 
14 
6 



1 ) Determiner le salaire mo yen de la filiate X et de la filiate Y. 

2) Determiner la variance et F^cart-type des salaires de la filiate X et 
de la filiate Y. 

3) Comparer la dispersion des salaires de la filiate X et de ta filiate 
Y. 

Exercice n Q 5 : xjr 

Le tableau ci-dessous donne les chiffres d'affaires mensuels 
r£alis£s par un magasin pendant n nombre de mois. 






Chiffre d'affaires 


Nombre de mois (ni) 


(en 10* DH) 




[Ml 


3 


Ml 


4 


[6,8[ 


m 8 


[8,101 


5 


[10, 14[ 


n 5 g. 


[14,18[ 


6 
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[18, 24[ 
[24, 30[ 


6 
13 



On donne en plus les informations suivantes: 
-la density d'ehfectif de la 3eme classe est le double de la deuxi&me 
-la density d'effectif de la cinquteme classe est identique k celle de 
la quatri£me. 

1) D£finir pour cette distribution : la population statistique, l'unit£ 
statistique, le caractere et la nature de la variable statistique. 

2) Determiner m, ns et n. 

3) Tracer I'histogramrne de cette distribution. On presentera au 
prealable un tableau precisant pour chaque classe, son amplitude 
a ( et la hauteur de chaque classe hi (sans utiliser les frequences) 
representee sur rhistogramme. En d£duire sa classe modale en 
pr£cisant sa signification. 

■4) Calculer le chiffre d'affaires mensuelles m£dianes Me par 
interpolation lineaire, en pr£cisant I'hypothese sous-jacente & cette 
methode. 

5) On regroupe la 4" me et la 5*' m " classe ensemble. Calculer dans ce 
cas le chiffre d'affaires mensuels moyen .v et i'£cart type o de la 
variable etudiee. 

6) En utilisant ces resultats calculer le pourcentage des 
observations contenues dans un intervalle sym6trique I de 
longueur 2o et centre en x (I =[ x -o , x +o ]) 
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Chapitre 4 



Caracteristiques de forme 



I.- Introduction : 

Lorsque Ton repr£sente graphiquement une s£rie 
statistique, on peut remarquer qu'une telle distribution pr€sente 
une symGtrie ou non, mais pour la mesurer, par exemple, on doit 
utiliser une caracteristique de forme. 

i 




Mode 
Hidiane 

Mouenne 

Distribution sym6trique 




Mode Mc Moyerwc 



Distribution asynuHrique 
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IL- Les Moments: 

l.-Moment simple : 

Le moment d'ordre r d'une s£rie statistique par rapport a 

une valeur quelconque Xo est : 



m -^2>'- x *) r n. 



si 



xo = alors m r =^-Jxfni 



ce qui donne le moment simple d'ordre r. 
Remarques : 

* La movenne arithm£tique 

— 1 k 

X=— Yx n. =m, est le moment simple d'ordre 1 

Mm 



Le moment simple d'ordre est 



1 



m, 



*— Yx"n = — Yn, = — 

At £- i ' ' \3 &*> ' \J 



.£., 



Nt 



N*?, 



N 



2,-Moment centre : 

Lorsque x„= x , on obtient le moment centre d'ordre r : 



pr=Jr2;(xi-x) r ni 



Ntr 



SL r est pair, \i t est un parametre de dispersion. 
Si r est impair, \x , est un parametre de symetrie. 
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En particulier : 

Vi = M^ (x *" x)n " 



6 = 



1 vp 1 _ k 



= rrE x . n i -T7 x Z n i =x-x=o 



„#& N& 4 J N £i 

et f*2 s j^2>i -x) 2 n. t =Var(X) . 

3.- Relation entre mr et ux : 

En utilisant que Vx et Vv des r£els 



(x + y) r = £ C^x'^y 1 Formuledebindmede Newton 



■■i 



ou les identity remarquable (a - b) 2 , (a + b) 2 ,..., on obtient : 

/ f 

p, =m,-3m,m 2 +2m, 

p 4 = m 4 -4m,m 3 4-^mfnij -3mf 

p 5 = m- -5m,m 4 + 10m 2 m, -4mf 

...etc. 

IIL- E/Asvmetrie 

Une distribution statistique est symetrique si sa 
representation graphique est symetrique par rapport A I'axe 
\ erHcal x = xou si les valeurs equidistantes de sa valeur central* 
ont une frequence £gale. 
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Dans ce point central, lorsque la serie est symetrique, 
coincident la moyenne arithmetique, la m£diane et le mode. 

x ■ Me = Moj 
(s'il y a plus d'une seule mode, coincident seulement 
Exemplel : 

x- — = 7 
14 

2 2 
Mo = 7 

x= Me = Mo = 7 



Xi 


nj 


riict 


niXi 


3 


3 


3 


9 


5 


2 


5 


10 


7 


4 


9* 


28 


9 


2 


11 


18 


11 


3 


14 


33 




N=14 




98 



3 4 3 6 S 



* m 



7 *i* ** 



Diagranme en batons des ru 
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Exemple2 : 



Xi 


m 


nict 


niXi 


3 




5 


15 


5 


1 


6 


5 


7 


3 


9* 


21 


9 


1 


10 


9 


11 


5 


15 


55 




N=15 




105 



- 105 _ 

x= = 7 

15 



N 15 „ Xlc „ 

— = — = 7,5=>M<§ = 7 
2 2 



Mo = 3 et 11 




«u 



Diigratnzne en batons 

Lorsque la s£rie statistique n'est pas n'est pas sym£trique, 
on dit qu'elle est asym£trique et alors on a plus x = M£ =Mo. 

On peut mesurer son asym£trie par le coefficient de 
Pearson qui se d£finit par : 
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En effet, si la serie est sym£trique et elle a un seul mode, alors 
x=MoetA r =0. 



Mo= X 



Le coefficient d'asymetrie le plus important et le plus utilise est le 
coefficient de Fisher que se dtfinie comme : 



g,= J 



o(x) 3 



(2» fffwr H? 



1 k 

-ec u = — Y (x - x) ? n , est le moment centre d'ordre 3. 

• si gi = alors la distribution est symetriqu e. 

• si gi < alors la distribution est asymetrique a gauche ou 
on dit qu'elle est oblique a droite. 
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X< Mo 



X filo 



• si gi > alors la distribution est asymetrique a droite ou on 
dit qu'elle est oblique k gauche. 



X > Mo 




86 



4ETIHJP 



.com 



Statistiaue Descriptive. 



Caracteristiaues dc forme 



IV.- L'Aplatissement 

Une s£rie statistique est plus ou moins aplatie suivant que 
les frequences des valeurs proches des valeurs centrales sont plus 
au moins elevees par rapport aux autres. 

Les mesures d'aplatissement s'appliquent aux distributions 
unimodales et symetriques ou peu asymetriques. 



phs aplatie 



maris aplaae 



Entre les deux cas, il existe un cas normal ou moyen c'est le 
cas des distributions moyennement aplaties. 
Les series statistiques plus aplaties sont dites 
PLATYKURTIQUES. 

Les series statistiques moins aplaties sont dites 
LEPTOKURTIQUES. 

Les series statistiques moyennement aplaties sont dites 
MESOKURTIQUES. 

■PLATUS" signifie large. 

"LEPTOS" signifie mince. 

"MfeO" signifie moins que, inferieur h, manque de... 
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"KURTOSIS" signifie sommet ou bosse. 
Pour mesurer le degre d'aplatissement, on utilise le coefficient 
de Kurtosis. 




• si g2 - alors la distribution est m£sokurtique ou 
normale. 

• si g 2 < alors la distribution est platykurtique. 

• si g2 > alors la distribution est leptokurtique. 

Exercices 

Exercice n°l : 

Le tableau ci-dessous donne les chiffres d'affaires mensuels 
realises par une entreprise commerciale pendant 36 mois : 



Chiffres d'affaires 


Nombre de 


(en 106 DH) 


mois (ni) 


[3,6( 


7 


[6,8[ 


6 


[8, 10[ 


5 


[10, 14[ 


8 


[14,18[ 


6 


[18,23[ 


4 



1°) Calculer le mode et la moyenne de cette serie statistique. 

Cette distribution statistique est-elle symetrique ? Pourquoi ? 
2°) Calculer sa variance et son ecart type 
3°) Determiner son coefficient de variation. Conclure. 
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Exercicc n Q 2 : 

On etudie les revenus (Annuels en milliers de dirhams) d'un 

ensemble de families d'un quartier de T£touan, les donn£es sont 
regroupSes dans le tableau suivant : 



Revenus 
annuels 
(en 10* 
DH) 


[18;30I 


[30; 36[ 


[36;42[ 


[42;54[ 


[54 ; 60( 


[60;66[ 


Effect if s 


13 


219 


20 


46 


50 


82 



1. Pr6ciser les caracteristiques de cette s£rie (population, taille 
ou 1'effectif total, individu, caractere etudie, type de 
caractere et modalites). 

2. Calculer la moyenne x de cette s£rie statistique 

3. Dresser 1'histogramme de cette serie statistique puis 
repr£senter son polygone. 

4. Determiner le mode Mo de cette s£rie, graphiquement et 
par lecalcul. 

5. Calculer la m£diane Me de cette s6rie statistique en 
explicitant vos calculs. 

6. La serie £tudiee est-elle sym£trique ou asymetrique? 
Justifier votre r£ponse. Pouvait-on prevoir ce resultat? 
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Chapitre 5 : 



Caracteristiques de concentration 

L- Introducrion : 

Plusieurs ph£nom£nes economiques necessitent des etudes 
de concentration et repartition d'une des variables dont ils 
dependent. Par exemple, la concentration des salaires, des 
revenus, de production,. . .etc. Les caracteristiques d£j& vues 
comme la moyenne, la variance, etc... ne r£pondent pas k cette 
6tude, alors on a construit de nouvelles caracteristiques dites de 
concentration mais due k la nature des probl£mes £tudi£s, on 
considers que des variables continues a valeurs positives. 
II.- La mediate (Ml) : 

La mediale est la valeur de la variable statistique telle que la 
somme des observations inferieure k elle est egale k la somme des 
observations sup£rieure k elle. Done, e'est une m£diane sur les 
valeurs "niCi" au lieu des "n*". Pour cela la mediale se calcul de 
forme analogue k la m£diane. 
Exemple : 

Calculons la mediale des salaires annuels du personnel (en 
milliers de DH) d'une entrepris : 



% ^ETIWJP 

.com 



Statistique Descriptive. 



Caracteristiuues de concentration 



[a* e il 


ni 


Ci 


niO 


(niCi)cT" 


[40, 50[ 


12 


45 


540 


540 


[50, 60[ 


14 


3D 


770 


1310 


[60, 70[ 


20 


65 


1300 


2610 


[70, 80[ 


30 


75 


2250 


4860* 


[80, 90[ 


14 


85 


1190 


6050 


[90, 100| 


10 


95 


950 


7000 




N=10O 




7000 





On a ^ n,C ' = ^* = 35oo . On cherche cette valeur dans la 
2 2 

colonne des (n,Ci)cfr. la l prt ' valeur qui la d£passe est 4860. Done la 

classernedialeest[70,80[ 

On applique, alors, une formule analogue a celle de calcul de la 

mediane : 



EVi 



-<w w c,,)r1 



Ml = La + 



a 



n c 



M1 = 70 + 2*»Z*!°.,o. 73.96 



Tl 



50 



Interpretation : 

La masse salariale de l'entreprise, versee annuel lement au\ 
employes montre que le partage en 2 blocs egaux s'eft'ectue pour 
la valeur de 73.960 DH. Autrement dit, la moitie de la masse 
salariale est regue par le personnel qui a un salaire inferieur h 



4ETIWJP 



.com 



• 



• 



Statistioue Descriptive- Caracteristioues de concentration 

73.960 DH et 1'autre moiti£ est ret;ue par ceux qui ont un salaire 
superieur a 73.960 DH. 
Calcul de la concentration : 

II existe plusieurs demarches pour effectuer ce calcul, la 
plus simple se compose des Stapes suivantes : 

• Calcul de la rn£diane de la serie. 

• Calcul de la m£diale de la s£rie. 
Mesurede I'ecart mediale-m£diane (AM). 

Cornparaison de cet ecart a l'intervalle de variation de la 
serie. 
Calcul de la concentration pour l'exemple precedent : 

On a d£ja calcule, pour cet exemple, la m^diane et la 
m£diale, on a : 

M£ « 71,33 et Ml = 73,96 

AM = Ml - M£ = 73,96 - 71,33 = 2,63. 

L'intervalle de variation est : 100 - 40 = 60, d'ou 



,., « =W3 = 0.043 

interval ledevanation 60 



En g<*n£rale, I'indice I = ^ = MI-Me 

intervalledevariation Vendue 

est Line valeur comprise entre et 1 qui mesure la concentration, 
indiquant une grande concentration lorsqu'elleest grande (proche 
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de 1) et une equi-distribution lorsqu'elle est petite {proche de 

zero). 

Si I = 0, alors il y a equi-distribution absolue. 

Si I = 1 , alors il y a maximum concentration. 

Done, pour l'exemple, les salaires sont equi-distribu£s. On a 
la concentration est faible. 
III.- Courbe de Lorenz et Indice de Gini: 

1,- Courhe de Lorenz : 

Consid£rons, le cas de 1' etude de la variable qui repr£sente les 
salaires d'un groupe d'ouvriers. On a construit le tableau suivant 
pour analyser la concentration des salaires : 



[eii,e;[ 


ni 


Ci 


njcj 


met* 


(niCj)c^ 


Pi = n < cT ioo 




100 




[p.v ei[ 


m 


C| 


nji i 


met" 


Gtttfdcf 


Pi 


Hi 






I«'i, e2[ 

• 


n> 


O 


naca 


nvf 


(ll2V2)0^ 


P* 


q* 






[e.i, <-,[ 


IV 


ii 


B& 


n t ct* 


to*** 


P« 


• 
<* 






[tVl. t*k[ 


riK 


Ck 


OfcCfc 


nkv'f' 


(iftCljcf 


? - 


< 

^ 








N 




2w 
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Ou les produits "nic" represented la masse salariale re<;ue par les 
W ouvriers dont le salaire est compris entre e.i et e t . 

Les "(n^cK represented la masse salariale regue par les 
"nict" ouvriers avec des salaires inferieurs £ cette masse. 

Les valeurs "p*" represented, en pourcentage, les 
frequences relatives cumutees des ouvriers. 

Les quantites "q" repr£sentent la masse salariale cumutee 

(exprim£es en pourcentage) sur la masse salariale totale Yn.q . 

i 

Les deux dernieres colonnes de tableau nous informent sur 
la concentration des salaires. 

La distribution des ouvriers et des salaires exprim£e par les 
valeurs (p s , qi); i=l, ..., k, se repr^sente graphiquement a l'aide de 
la courbe de concentration appel£e courbe de Lorenz; c'est la 
courbe qui passe par les points (pi, q,) 



*M - 




En gras c'est la premiere bissectrice. 



* P 
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* Si les salaires sont equi-distribues, alors pi=q, (Vi=l, ..., k), done 
la courbe de Lorenz coincide avec la !*• bissectrice. 

m Dans le cas de maximum concentration q,=0 (i=1, ..., k-1) et 
qk=l00, alors la courbe de concentration co'incide pratiquement 
avec le triangle OAB. 

* Pour des situations de concentration intermediates, la courbe 
de Lorenz occupe une position intermediate entre ces 
situations extremes. Elle s'approche plus a la 1*« bissectrice 
lorsque la concentration est faible et s'£loigne de la 1*« 
bissectrice lorsque la concentration est forte. 

2.- Indice de Gini 

A partir de la courbe de Lorenz, on constant une mesure de 
degre de concentration appetee "Indice de Gini" notee "lc". 

Geometriquement, 

T aire 5 



*g = 77 



airedu triangleOAB 



etona ;0<L<1 
Evidement, cet indice est une mesure de 1'approximation de 
la courbe de Lorenz a la l |,r " bissectrice et par suite de la 
cyinvntration des salaires. 
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k-i k-1 

— =1-' 



>C-*T3 



k-\ 



2> Zp. 

qui rnesure aussi ('approximation de la courbe de Lorenz & la 1*™ 

bissectrice mais en utilisant une autre propri£U? geom£trique 

differente de celle de I'aire S. 

■ Si Ir.= alors pi=qi et les salaires sont £qui-distribues. 
a Si Ig= 1 alors qi = et il y a maximum concentration. 
j Si 0< fc< 1 alors il y a grande concentration si h est 

plus proche de 1 ; et une equi-distribution si I G est 

plus proche deO. 

Exemple : 

Reprenons I'exemple precedent ; on a calculi 1'indice I pour 

cet exemple et on a trouv£ I = 0,043. 
Calculons, maintenant 1'indice de Gini lo. 



[ei-i, e f [ 


ni 


Cj 


"»ci 


nid" 


(meOct 


p. = nct 100 

r ' N 


(".<>' 
£">*' 


100 




[40, 5()[ 


12 


45 


540 


12 


(540 


12 


7.71 






[50. 60[ 


14 


55 


770 


26 


1310 


26 


IS,71 






[60, 70[ 


20 


65 


1300 


46 


2610 


46 


37,28 






[70, S0[ 


30 


75 


2250 


76 


4&60 


76 


6^>,43 






[SO, 901 


14 


85 


n*) 


90 


6050 


I'll 


86,43 






[90, t00| 


10 


l »5 


950 


100 


7000 


101) 


100 








N=lon 




7lHR> 
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Si nous observons les deux demises colonnes nous avons : 
Au 12% des ouvriers qui gagnent peu leur correspondent le 7,71% 
du total des salaires, au 26% des ouvriers qui gagnent peu leur 
correspond le 18,71% du total des salaires, etc... Alors que s'il 
avait une repartition egalitaire des salaires, nous aurons que au 
12% des ouvriers leur correspond le 12% du total des salaires, au 
26% des ouvriers leur correspond le 26% du total des salaires, 
etc.... ce que Ton n'a pas dans cet exemple du a une telle 
concentration des salaires (meme t'iable !). 




]®j * 



L'indicedeGini 



k.= 



25(1 



Sp. 



1=1 



I.. = 1-0,878 = 0,122 
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Ce qui indique une taible concentration des salaires de ce groupe 
desouvriers. 

Exercices 
Exercicen !: 

Soit la serie statistique des salaires d'une entreprise : 



Salaires 


Nombre d 'employes 


X-50 


30 


50-100 


40 


100 - 200 


20 


200 - 300 


10 



1) Retrouver la borne inferieure X de la premiere classe sachant que 
le salaire moyen est de 94. 

(Pour la suite des calculs. retenez la valeur trouvee a la premiere 
question.) 

2) Donner I' interpretation et la valeur de la mediane (Me). 

3) Calculer le troisieme quartile. le septieme decile et le percentile 
35. 

4) Determiner la variance et I'ecart-type. 

5) Donner Pinterpretation et la valeur de la mediate (Ml). 

6) Que peut-on dire de la difference AM=MI-Me ? Comparer-la a 
Tetendue. Interpreter le resultat. 

7) Construire la courbe de Lorenz. 



98 



^ETUUP 



.com 



Statistique Descriptive. 



Camcteristimies de concentration 



8) Determiner I'iiulice de concentration de Gini. Conclure. 

Exercice n°2 : 

Pour une meme duree de travail, les salaires d'une 

entreprise se repartissent comme suit : 



Salaires en 


Nombre de 


dirhams 


personnes 


De 3000 a 4000 


11 


De 4000 a 5000 


26 


De 5000 a 6000 


63 


De 6000 a 7000 


81 


De 7000 a 8000 


35 


De 8000 a 9000 


21 


1 De 9000 a 10 000 


13 



1°) Determiner le salaire median. 

2°) Determiner la mediate. 

3°) Tracer la courbe de concentration de Lorenz et calculer l'indice 

de Gini. Conclure. 

Excrcice n" 3: 

La distribution des salaires horaires, en dirhams, des N 

employes d'une grande entreprise est donnee par : 
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Classes 


Effectifs 


[50;K10[ 


10 


[100;150[ 


14 


[150;200[ 


16 


(200 ; 250[ 


n 



Ces donnees sont incomplet car, a la suite d'un incident, I'effectif 
de la derniere classe est illisible; alors, on a decide de le noter 
provisoirement par n. Mais, on sait que la mediane de cette serie 
stalistique est 153,125 DH. 

1. Exprimer la moyenne arithmetique de cette distribution en 
fonction de n. 

2. Exprimer la mediane de cette s£rie statistique en fonction 

de n, sachant que la valeur N/2 n'a pas ete trouvee 

exactement parmi Ies effectifs cumules croissants. 

Determiner n et puis N ie nombre d'employes de cette 
entreprise. 

3. Retrouver la valeur numerique de la movenne arithmetique 
en remplacant la valeur de n trouvee dans I expression de 
la moyenne exprimee en 1°. 

4. Calculer la mediale de cette serie statistique. 

5. Representor la court* de concentration (ou courbe de 
Lorenz). 
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6. Calculer 1'indice de concentration (ou indice de GINI) et 
conclure. 

Exereicert°4: 

Le tableau ci-dessous donne la repartition de 200 

exploitations agricoles, dans un certain pays, selon la 5AU 
(surface agricole utilisee) exprimee en hectares : 



SAU (en ha) 


Frequences (en %) 


deOalO 


22 


de 10 a 30 


28 


de 30 a 50 


27 


de 50 a 100 


23 



1) Determiner le pourcentage des exploitations agricoles qui 
ont une SAU superieure a 30 ha. 

2) Determiner la SAU la plus frequente. 

3) Donner la valeur et Interpretation de la mediane (Me). 

4) Calculer le troisieme quartile(Q;0 et le cinqui£me decile 
(D 5 ). 

5) Donner T interpretation et la valeur de la mediale (Ml). 

6) Calculer la difference AM=Mi-Me. Calculer Find ice de 
concentration. 

Interpreter le resulrat. 

7) Construire la courbe de Lorenz. 

8) Determiner I'indice de concentration de Gini, Conclure. 
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Chapitre 6 : 



Aiustement et correlation 



Ajustement et correlation 



line aire 



L-jntroduetion; 



Dans ce chapitre, les variables statistiques sont supposees 
« discretes ». Pour passer aux variables continues, il suffit de 
remplacer les classes par leurs centres. 
IL- Notion d'aiustement : 

Dans les chapitres precedents, nous avons vu que les tableaux 
statistiques ont au moins deux colonnes : 

• Une colonne pour les valeurs de la variable xi 

• Une colonne pour les effectifs ni ou les frequences fi. 
Nous avons aussi precede & des representations graphiques. 

M 



Ml 



'ft 



': 
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mi 






-n 



Parfois, dans ces representations graphiques, les points 
represents semblent se repartir suivant une configuration assez 
r£guliere (une droite ou une parabole, ou une courbe). 

L'ajustement consiste en substituer aux effectifs ou frequences 
effectivernent observes des effectifs ou frequences calcules & l'aide 
de procedes que nous allons envisager. 

On contort, en examinant ces representations graphiques, que 
la premiere etape d'une operation d'ajustement sera la recherche 
de la forme generale de la courbe d'ajustement la seconde etape 
etant la determination de liquation de la courbe d'ajustement, 
equation telle que : 

ni ou fx =/(a) avec/une fonction . 
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1- Ajustement graphique ; 

Lorsqu'on a, dans une representation graphique, un nuage de 
points, un premiere ajustement conduit a tracer une courbe simple 
r£guli£re qui cornpense a peu prfcs les ecarts positifs ou n£gatifs 
c'est-a-dire qui laisse & peu pr£s le meme nombre de points de 
part et d'autre. 

Ainsi les deux figures pr£cedentes conduiraient a des 
ajustements manuels qui se presenteraient approximativement 
comme suit : 



*\**t 





*l 



Dans le cas oO les points semblent se rtpartir de fagon lin£aire, 
plusieurs droites peuvent-etre candidates a ajuster ce nuage de 
points. 

Mais, ces droites sont paralteles r£gulierement espacees de part 
et d'autre d'une droite centrale. La droite d'ajustement est la 
droite centrale de I'ensemble des droites telle que les points a 
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ajuster se repartissent £quitablement au dessus et au dessous de 
cette droite, et a I'intgrieur du reseau des parall&les. 

Cet ajustements manuel, bien que sommaire, donne en 
pratique de bons resultats surtout si la courbe d'ajustement 
cherchee est une courbe simple, une droite par exemple. 



Exemples d'ajustements praphiques lineaires : 



On dispose de tableau suivant : 





Ili 




2 


/ 




4 


10 




6 


1? 




a 


15 




9 


20 




13 


28 





La representation graphique de cette s£rie statistique est faite de 
six points. 
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Un ajustement Iin£aire est le plus approprie. 

Une droite d'ajustement a Ste construite rnanuellement et 
figure sur la representation. On determine facilement 1'fiquation 
y=ax+b de cette droite en Arrivant qu'elle passe par les points, 
M (4, 1 0) et A'(9, 20) 

On peutecrire 

10 = 4a + /> 
20 = 9« + fc 



Sa = U)^>a=2 



et b=10-8=2 



Soil une droite d'equation y=2x+2 
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2- Methode des points medians : 

Exemple : 

Un phenomene economique a fait l'objet d'une rnesure 

mensuelle au cours de 20 mois consecutifs. 

Representor graphiquement la s£rie statistique en question et 
ajustons par la methode des points medians les points obtenus. 



Mois 


Mesures 


Mois 


Mesures 


Mois 


Mesures 


Mois 


Mesures 


1 


17 


6 


198 


11 


196 


16 


216 


2 


164 


7 


190 


12 


208 


17 


226 


3 


168 


8 


188 


13 


218 


18 


236 


4 


172 


9 


188 


14 


202 


19 


232 


5 186 


10 


188 


15 


202 


20 


240 



On represente d'abord les 20 points de coordonnees 

respectives : 

(Ietl70);(2etl64);...;(20,240). 
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240 




1 2 3 4 5 5 7 a 9 10 n 12 13 W IS le 17 IS 19 20 



Mob 



ill.- Notion de correlation : 

Parfois, on peut se trouver en face d'une population telle qu'on 
puisse £tudier deux caracteres differents sur une rneme unite 
statistique : 



Variable 1 : X 


Variable 2 : Y 


Xi 

• 

• 
■ 

Xa 


• 
• 



n etant le nombre d'unite statistiques observees. 
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Une unite presente k la fois la mesure x\ de X et la mesure )'i de Y, 

avec/=7, ..., n 

Sur le tableau precedent, on pourra s'attacher a l'6tude des 
variations simultanees (croissance ou d£eroissance) des deux 
caracteres X et Y. 

Trois situations peuvent se presenter : 

1) Aucun lien entre X et Y. 

2) X et Y sont lies fonctionnellement. 

3) Sans £tre lies fonctionnellement, X et Y sont en 
dependance, plus ou moins marquee. 

On dira alors que X et Y sont en correlation (positive ou 
negative). 

Exemple : 

- Le poids et la taille des enfants d'une £cole sont deux 

variables en correlation positive. 
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1- Mise en evidence graphique de l'existence d'une 
correlation entre deux variables : 

Sur un rep£re, on repr£sente les points de coordonn£es tirees 
du tableau pr£c£dent : 

&u yd ; to, V2) ; ■ ■ • ; U, yd ; . . . ; (v n , >a 

Les points formeront un nuage de points: 



• • 



♦ * * 



•• 



* • • ♦ • *•*• 



•• • ; •••♦• 



Ce nuage peut se presenter de divers fagons ; 

a ) Les points se dispersent au hasard dans le plan : 

Comme dans la figure precedente. Alors X et Y peuvent etre 
ind^pendantes Tune de I'autre (car le nuage ne presente pas une 
influence claire d'une variable sur I'autre). 
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b) Les points peuvent se regrouper en un nuage de 
forme assez allongee, assez aplatie : 

*Y Y 



* • 



• 



■* X 



A une valeur fixee de Tune des deux variables correspondent 
des points qui pr£sentent, pour 1'autre variable, des valeurs assez 

rapproch£es. 

Les deux variables semblent alors etre li£es, c'est-a-dire 
corr£lees soil positivement (croissent ensembles), soit 
nGgativement (decroissernent ensembles). 

On peut alors dire que X et Y sont corr6l£es ou qu'il existe une 
correlation entre X et Y. 

2- Mesure de la correlation. Coefficient de 
correlation lineaire : 

La correlation est mesuree par un coefficient appel£ le coefficient 
de correlation lineaire. Les form u les de coefficient de correlation 
lineaire sont : 
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Ajustement et correlation 



r = 



SU-Vfe-fT 



A 



rZfc-flfri-fl 



r = 



CovtX.Y) 






Cov{XJ) 



Cov(X,Y) 



yjVar(X)VariY) C{X)o(Y) 



Done, d'apr^s ceci, on voit que - 1 < r < 1 



Si r = 1 , alors on a une forte correlation positive. 

Si T « — J , alors on a une forte correlation negative. 

Si r = , alors on n'a pas de correlation. 

Exemple de calcul du coefficient de correlation lineaire entre 
deux variables X et Y ; 



-V. 



is 

23 
24. 

2d 

26 



V, 



2Z- 
24 
28 
22 
32 
24 
32 



r. - S" 



91 * 5«"> 

-JS-i | 3-3-i £ 



-* 1 
-3.1 
-2 2 

-15 
♦ 2 3 
-3 1 
•4.fl 

•7.9 



y. - v 



ft - *V 



•SO -J 

•2 4 

-s a 
+ i_6 

-2. « 
'I 6 

•136 

- i a <- 



152-C-l 
SS . 5*1 

*«1 

3 -4; 

3 «1 
a 41 
OC1 
24 M 
54 Si 
62 41 
9 14 f*0 



- T :i J 



5 76 
70 S6 
2.56 

S.76 

:se 

1*2 56 



», - S"/i i y, - Y ;, 



*51 &-"= 
7 44 
i? *>A 
* -G4 
-6St 
-D 1c 
-27 J.j 
-62 S4 
S3 74 
-353. 60- 
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Moyenne arithmetique de X : X = = 26,1 



— 304 
Moyenne arithmetique de Y : K = : — = 30,4 



Coefficient de correlation lineaire : 

T W 351,60 



JZU-JfJ-'U-K) 2 V314>90x492,40 



351.60 351,60 



Vl 55056,76 393,77 

Done on a une correlation positive, comme l'indique deja la 
representation graphique et assez serree, le coefficient r ayant une 
valeur absolue voisine de 1. 

3- Droite de regression lineaire: Methode de 

moindres carrees: 
a- Methode des moindres carrees : 

Le probleme k resoudre est le suivant : il faut determiner les 
differents param£tres d'une fonction on : y =f(x) qui ajuste £ la 
fagon la plus satisfaisante les observations faites, la fonction 
retenue devant cependant conduire a une courbe 
d'ajustement : 
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*i 


y. 


Xk 


3\ 



>• Observations 



Supposons y =f(x) est i'ajustement envisage (on a sa forme, 

son type, mais pas ses param£tres!) 

Graphiquement: 



y 








} '*> 


, /{nk-z,} 




Jw; 


N 




1 
1 

i 
i » 1 


1 ' 


i ' 


I p. 



Calculons 



JTi *- ._- %. t X* 



.V 



[v, - /U,)f ;[>' 2 - /(*, )] 2 ;-;[>;_, - /(-r M )f ;fo - f(x k )) 2 

On trouve differentes valeurs de param£tres & determiner qui 
conduisent k differentes fonctions / telle que y =f(x) 
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Alors, nous cherchons les parametres qui donnent la fonction/qui 

rend la plus faible possible la somme des carrees iy,~f(Xt)f 

(methode des moindres carres). 

Conclusion ; On cherche la fonction / telle que y = f{x) qui 

permettra de caiculer les / (%) tels que ^[y,-/^)? soit 

minimum observes calculee 

On dispose d'une distribution a deux variables statistiques X et 
Y pour faquelle la representation graphique a montre que Y peut- 
etre ajuste par rapport & X par une droite d'equation 
y=f(x)=ax+b. Alors, par la methode des moindres carries, il faut 
que : 

min£[_y, - flx d )f c'est-&- dire min ^[v-av, -b\ 

Le probteme consiste done a determiner les parametres a et b. 

Rappelons que les valeurs numeriques de X\ x\ et >i, ..., y* 

sont connues et lues directement sur le tableau statistique. 

Nous allons cakuler la derivee par rapport a a et a b de 

V[v,-o\, -b\ , puis egaler a zero les derives obtenues : 
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\(M 



da 



= 



<l=l 



db 



= 



-2T (» -«*-*)«« 



<=1 



-zJfaft-axf-iaJsO 

-2£(y, -**•-*) = <) 



£=1 
ft 









i 

i * 


-2>?- 

(l) 

(2) 


;=) 
-bk=0 



<=l 



1=1 






= v - ar 



On remplace dans (1 ) => o^ x; + ( J - ax) £ a, ■ J .t, y g 
& 2 -*2*i = Z*,J, -y]T.r ( 



^*«i 



"i j 



M 



i~l 



(I = 



i^j frrj _ * . (-1 



i»l 



M 



a = 



Cm-(A'.K) 

Var(JT) 

Finalement : 



* 1 



f _ Cm'(.Y.K) 
/; = v - a* 
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Remarque : On a une autre formule : 



a = ^ 



2>,-*) : 



/=l 



Lorsque deux variables sont en correlation lin£aire, alors on a : 
y = ax +b est I'ajustement de y k partir de x, Cette droite s'appelle 
«droite de regressions on droite d / «estimation de v a partir de x ». 

Le proc£d6 de determination de ['equation de la droite de 
regression est gSneralement fond£ sur le principe des moindres 

carres. 

X = variable cause ; Y - variable consequence 

D'apr^s la m£thode de moindres carries : 



a = 



izi_^ et b = v - ax 



£U-*) a 



/=i 



Exemple : 



a 



351,60 = U1? fr = 30,4 -(1,1 17x26,1) = 1,25 



3 1 4.9 
Equation de regression : v = 1,1 17.V + 1.25 

Par analogie, on pourra chercher l'equation de la droite de 
regression de X par rapport h Y f equation de la forme x = a V + b' 
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Zk-vXv-y) 



avec 



amJ± 



— \2 



et b' = x-aj 



Ziy.-y) 



i -I 



Pour le meme exemple on a : 



492,40 
Equation de regression de X par rapport a Y est : 



b'= 26,1 -(0,714x30,4) = 4,4 



x = 0,714 v + 4,4 



Remarque : 

On a: 



fl=-29. 



Ife-Ifo-D iK-v,--Xv,-y) 



1 



Var(tf) 

r_ IU,-.T)(y,-y) EU-rF 



a m*-Wz&-W z r - a* - y) 

£(*, --v) : Vt/r(X) 

--— T-r d OU ;- = «— 1— I 

o o(K) a(K) 

De meme r = </' ; , 

o(x) 

Exem P le : ( I'ajustement linaire par la droite des moindres carrees) 
Soil le tableau suivant ( deja vu dans I'ajustement graphique 

lineaire) 
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*itf 



X; 



Cl -*>i<ft-?) 



(^-s-)0 : i - ft 



\Xf -x 



rv 



15 



10 
13 
15 
20 

25 



42 



93 



14 

40 

?S 

120 

2,50 
3£4 



m 



4 

t 

16 ; 

36 I 

54 

£1 | 

169 



5 

_ a 

-2 

♦ 1 



-S.5 
-5.5 
-2.5 
1 -0.5 

12.5 



Wl 



41$ 

2S.5 
2.5 
-0.5 

3 



145 



2S 

9 
2 
1 
4 

36 



ffi 



X=- = 7 

6 6 



5>rft-?2> 



fl = 



i^i 



y=^ = i5.s 



'- 1 _ 



796-(l5,5x42) _ 796-651 145 
370 -(7x42) "370-294" 76 



« 1,908 



M M 

/>= v -at = 15,5- (l,908x 7) = 15,5- 11356 = 2,144 
Done, i'equation de la droite d'ajusternent sera: 



v = 1,908x + 2,144 



*t 



1 

2£ - 



24—* 
iO ■ 
16 - 
22 — 

3 — 



V n i.»OBx+ 2.144 




• 



i 1 ! i ! r i 

2 A 6 S 10 22 M 
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Calcul du coefficient a en utilisant la formule : 



b = 2.144 
Remarque : 



145 

= — = i.sos 



Nous avons £crit dans la recherche du parametre b 

1=) &«[*-/&£] avec /(r) = « !+ 4 
Wrifions ce r£sultat sur le calcul num£rique qui vient d'etre 

fait, et en prenant fix) = i.OOBr 4- 1244 : 



h 




/<>,) = l,9G8.r + 2-144 


» -«%) 


•* 


t 




* 1,04 


* 


10 


^—6 


* 0.224 


6 


13 


13,592 


- 0.592 


$ 


15 


17,403 


- 24ft 


9 


20 


19.51& 


-0,654 


13 


2S 


26,$4S 


+ 1/332 


smog 



Ainsi la droite des moindres carres: 
Minimise l( y. — f(x )) : 
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- Passe par les points de coordonnees X — — - et 

tv 
f N 

- Rend nulle la somme alg£brique des differences 
entre ordonn£es reekkement observees, et ordonn£es 
calculGes & partir de la droite d'ajustement. 

Exercices 

Exercice n°l: 

Une distiribution statistique se pr£sente fe la fa^on suivante : 

1) Repr£senter la graphiquement. 

2) Deux statisticiens differents ont abouti aux droites 
d'ajustement suivantes : 

- le premier : y = -2x + 27,2 

- le deuxfeme : y = -1,9\ + 26 
En se fondant sur le principe des moindres carr6s 
apprecier lequel des deux statisticiens a realise le 
meilleur ajustement. On calculera pour les deux 

fonctions obtenues le total ( y\ - y : ajustes) 2 est on comparera les 

resultatsobtenus. 

3) Effectuer ensuite I' ajustement par la methode des moindres 

carres. 



X, 

• 


7i 


2 


21 


3 


22 


6 


15 


7 


14 


9 


10 


10 


8 


11 


4 


12 


2 
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4) Verifier, a partir de I'equation de la droite des moindres carr£s 
que Ie total ( \\ - ft ajustes) 2 est £gal a zero. 

5) Verifier, & partir de cette meme equation de la droite des 
moindres carrfe que Ie total ( v, - y, ajustes) 2 est plus faible que 
chacun des deux totaux calcules en question 2). 

Exercice n°2 : 

Une entreprise commercial consacre une certaine somme & 
des operations publicitaires au debut de chaque mois. 

Dans Ie tableau ci-dessous sont recapitules, mensuellement, 
pour 2008. 

Les sommes consacrees k ces operations. 
- Les montants des ventes correspondantes. 



Mois 


Depetises de publicitesx 
ien miihoru de dii-hams 1 


Ventes >'; 

:«n millions d« 
dirhains) 




Janvier 


2,4 


3S 




Fevrier 


3 


42 




Mars 


3 


42 




April 


2,5 


39 




Mai 


3.2 


40 




]xiit\ 


3-? 


4? 




r u Ji*t 


^ 


35 




Aoiifr 


1.8 


24 




Septemfcre 


"• 
J 


38 




Octobre 


5.2 


40 




?vOV*iTUU<* 


3.S 


44 




Dece-mbre 


4.6 


53 
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On demands de: 

1) Calculer le coefficient de correlation lineaire existant entre 

les deux variable x et y. 

2) Determiner liquation de la droite d'estimation de y a partir 
dex. 

Exercice n Q 3 : 

Un tableau statistique se presente comme suit : 

1) Calculer le coefficient de correlation 
lineaire entre les variables x et y. 

2) Determiner l'equation de la fonction 
de regression permettant d'estimer y a 
partir de la connaissance de x. 

3) Representer graphiquement le nuage 
des points et de la fonction de regression. 



»l 


n 


-5 


33 


-1 


25 


3 


17 


10 


3 


13 


-3 
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Chapitre 7 : 

Series Chronologiques 

L- Introduction: 

La provision est un Element cte pour la prise de decision. 
Done, pr£voir Involution de I'environnement economique & 
travers tous les facteurs qui peuvent exercer une influence sur le 
resultat, est une etape primordiale qui precede la prise de 
decision. Ce qui suppose une precision de la situation economique 
une fois que les choix auront ete effectu£s, e'est enfin contrdler, 
e'est-^-dire comparer les resultats obtenus avec ceux qui etaient 
pr£vus. 

Le plus souvent, les donnees utilises dans le domaine de la 
prevision proviennent des series chronologiques. Cest done par 
l'etude de ce type de donnees que convient d'aborder ['analyse 
des rnethodes de provision. 

Definition: 

Une s£rie chronologique ou temporelle est une suite 
d 'observations d'un phenomena au cours du temps. 
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Exemple: 

La statistique des ventes mensuelles d'un certain produit constitue 
une serie chronologique, de m&ne que revolution annuetle du 
niveau general de prix ou encore du taux d'£quipement des 
manages en machines & laver. 

L'etat du phenomene est reper£ & intervalles rgguliers selon une 
periodicite qui peut etre tr£s differente d'un probleme k un autre 
qui depend des possibility d'enregistrement, mais aussi de 
preoccupations op£rationnelles. 

Toute entreprise peut avoir facilement acc£s k un grand nombre 
des series interessantes, soit d'origine interne (statistiques de 
production, de commanded de livraisons ou encore de tresorerie), 
soit d'origine externe (statistiques de syndicate professionals, de 
la direction nationale des statistiques). Mais ces donnees ne sont 
g£neralement pas utitisables dans leur etat. 

La formalisation puis le traitement des series chronologiques sont 
deux etapes prealables a leur utilisation en mature de prevision 
oudecontrole. 
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IL- Formalisation des series chronologiques : 

Toute s£rie chronologique apparait comme le resultat de plusieurs 
mouvernents £l£mentaires qui se superposent. 

Un module de sSrie chronologique devra mettre en Evidence 
quelles sont ces composantes et quelles sont ses regies de 
composition. 

1.- Composantes des series chronologiques: 

Involution d'un phenomene au cours du temps est g£n£ralement 
determine par le mouvement de quatre composantes 
£l£mentaires : 

• La tendance Tt 

• La conjoncture Ct 

• La saison St 

• LeresiduRt 

a.-La tendance (Trend): elle represente revolution moyenne a long 
terrne du phenomene £tudie (on I'ajuste par une droite en 
general). 
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b.-La conioncture (cycle): e'est un facteur qui joue k moyen terme 
et qui se manifeste par des mouvements cycliques faisant alterner, 
sur plusieurs annees, des phases d'expansion ou de recession. 

c.'La saison (composante saisonttiere): elle se rapporte k des 
fluctuations de periodicity constante £gale au plus k l'ann£e, dont 
les causes sont diverses (traditions, congas, fetes, saisons, 
vacances, m£t£orologie...) (court terme) , 

d.-Le residu (facteur residue}): il recouvre un ensemble het£rog£ne 
dements que Ton regroupera en deux categories selon qu'ils 
introduisent des perturbations identifiables et done eliminables ou 
au contraire aleatoires . C'est une composante accidentelle ou 
impr£visible dependante du hasard et de raleatoire (Innovations 
technologiques imprgvues, catastrophes naturelles, greve, ...) 

2.- L'analvse graphique des composantes: 

Une serie chronologique se definit comme la succession des 
valeurs d'une variable ordonnees par un indicateur de temps. Elle 
se repr£sente generalement sous la forme d'un graphe tel que !e 
suivant : 
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Evolution des ventes mensuelles d'un certain 

prod u it 




-i r— »-■ 1 , 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 IS 1$ 



L'analyse des series chronologiques consid&re la decomposition en 
quatre types de variations: la tendance, la conjoncture, la saison, et 
le r€sidu. 



Le schema suivant illustre cette decomposition : 



Evolution des ventes mensuelles d'un produit 



200 
150 
100 

iso 

4> 





-50 

-100 



"*■/ 



— f-f - 

\ \ f \ ? \: 



i-*U 






— i_^ ■■ -/ . ; 



*-m 



— ---Saison 



tendance 



Conjuncture 
■»■"« Residue 
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3,- Reple de composirion des series chronologiques: 

la valeur observee k la date t de la variable etudi£e Yt, est 
tone t ion des valeurs prises a cette meme date par les diverses 
composantes : 

Yt=/(Tt,a,St,Rt) 

Deux sch£mas de composition principaux sont utilises ; 

• le module additif, 

• et le modele multiplicatif. 

> Dans ie module additif, la valeur Yt est la somme des 
valeurs prises par les differentes composantes: 

Yt = Tt + Ct + St + Rt 

ou St=St+m si le cycle saisonniere porte sur m 
peri odes. 

Dans ce module, 

3 Chaque €l£ment est mesure dans la meme unite que Yt. 

O Si la variation saisonniere manifesto une periodicity de m 

l—Ht 

peri odes alors: V$fsO : dans la mesure ou la tendance 



/=r-l 
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represente la moyenne du phenomene, il faut que les 
variations saisonnieres amenant Yt au dessus de la 
tendance soient compensees par des variations d'amplitude 
equivalente au dessous. 

O De fagon plus generate, et pour la meme raison, si la 
tendance a £t£ correctement calcul£e, I'effet moyen k long 
terme de chacun de ces Elements C, S et R doit £tre nul. 

Remarque: 

Dans le module additif, I'effet d'une variation de Tune des 
composantes sur Yt est independant de la valeur prise par les 
autres composantes. 

> Dans le Module multiplicatif, Yt apparait comme le produit 
des differentes composantes : 

Yt = Tt.Ct.St.Rt, 

ou Yt est mesure en unites (dhs, tonnes, etc..) de meme que la 
tendance ; les autres facteurs sont int£gres dans le module sous la 
forme de coefficients multiplicateurs de type St = (1+st), ou st est 

le pourcentage de variation due a la saison, par exemple. 

Le modele multiplicatif peut etre traduit sous forme additif 
si Ton utilise des logarithmes avec: 
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Log Yt = Log Tt * Log Ct + Log St + Log Rt 

Dans la mesure ou les fluctuations saisonnteres doivent se 
compenser sur m p^riodes dans le module additif, il faut que 



fir. 



Y g LogSt=Q, 



i=..i 



ce que revient h dire, puisque ^Log(St)= Log(J[\St) que le 
produit des coefficients saisonniers doit Etre £gal k 1. En fait, la 

condition ]~[& = 1, sera sou vent approchSe par la condition 



i=r-\ 



En effet, quand « si » est petit, 

on peut approcher Log {Si} = Log (l + si) par si. 

Dans ce cas, £ Lo 8 (&") est Equivalent h ^si . 

La condition ^Log(Si)~0 devientalors £(l + s/) = ™. 

Dans le module multiplicatif, les cornposantes ne sont plus 
ind£pendantes. L'effet saisonnier sera d'autant plus important en 
valeur absolue, que la tendance et la conjoncture seront elevees. 
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A priori, aucun de ces deux modeles ne doit £tre declare superieur 
& l'autre: il convient de les tester sur les donnees afin de reperer 
celui qui reproduit le mieux le phenom£ne consider. II faut noter 
egalement que des formulations mixtes peuvent etre utilises, 
comprenant une partie additive et une partie multiplicative. 

III.- Traitement des series chronologiques: 

Traiter une serie chronologique consiste i mettre en Evidence 
ces differentes composantes a l'aide d'une procedure de 
decomposition donnee. 

La technique la plus courante fait appel aux moyens mobiles 
pour degager Involution a moyen terme du phenomene, c'est-&- 
dire la combinaison de T et de C (c'est-£-dire de minimiser les 
fluctuations aleatoires). Une fois cette operation realist il devient 
possible de determiner la valeur des coefficients saisonniers, de 
m^me que la composante residuelle. 

1,- La method e des movennes mobiles: 

Etant donne un ensemble d'observations correspondantes a 
une serie chronologique, la determination des moyennes mobiles 
d'amplitude « h » se fait de la fagon suivante: 
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i. On forme des groupes de « h » observations et on 
calcul leurs moyenne. 

ii, Le premier groupe est form£ par les « h » premieres 
observations. 

iii. Les groupes suivants seront formes en excluant du 
groupe anterieur la premiere observation et en 
inciuant la posterieure (observation) dans le groupe 
suivant. 

iv. On continue le processus jusqu'a ce qu'on ne peut 
plus former des groupes 

Les movennes obtenues dans le processus anterieur s'appellent 
moyennes mobiles d'amplitude ou d'ordre « h ». 

Chaque moyenne mobile sera associee au point du milieu 
de i'intervalle de temps sur lequel elle a et£ calculte. 



Nous allons voir vapour h=3 



Donnees 



tl 



a 



Ytl 



Yt2 



Somme des 

groupes de trois 

observations 



Ytl+Yt2+Yt3 



Moyennes mobiles 



d'ordre 3 



Y2=l/3[Yt1+Yt2+Yt3] 
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t3 


Yt3 


Yt2+Yt3+Yt4 


Y3=l/3[Yt2+Yt3+Yt4] 


t4 


Yt4 


Yt3+Yt4+Yt5 


Y4=l/3[Yt3+Yt4+Yt5J 


tn-2 


Ytn-2 


i i • 

Ytn-3+Ytn-2+Ytn-1 


Tn-2=l/3[Ytn-3+Ytn-2+ Ytn-1] 


tn-1 


Ytn-1 


Ytn-2+ Ytn-1 +Ytn 


Tn-l-l/3[Ytn-2+Ytn-l+Ytn] 


tn 


Yhi 









de moyennes mobiles (pour la premiere et la derntere 
observations du tableau pr£c£dent), par.cons£quent dans les 
calculs posterieurs des moyennes mobiles on aura moins de 
donn€es que dans les "n" de depart. 

La methode des moyens mobiles repose sur le prfncipe suivant: 
Les variations saisonnteres disparaissent pratiquement lorsqu'on 
remplace les valeurs observes de la s£rie par des moyennes 
calculees sur une periode suffisamment longue (3 mois, 4 mois, 5 
mots,..., ou 12 mois). 

La periode doit etre choisie en fonction de la periodicite des 
resultats: s'il s'agit de variations saisonnteres sur une annee, la 
periode est 12 mois, 4 trimestres ou 3quadrimestres... 

La methode des moyennes mobiles est une methode de lissage, 
c'esM-dire qu'elle atlenue les variations d'une serie 
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chronologique. Comme telle, elle peut etre employee pour lisser 
une serie, que celle-ci presente ou non des variations saisonni£res. 
Les moyennes mobiles que nous avons consider^ sont des 
moyennes avee des ponderations £gales pour chacune des 
observations (parfois on les appelle non-pond£rees), il est possible 
aussi de consid£rer un ensemble de ponderations assoctees. 

II existe ainsi des moyennes mobiles ponder^es, dans lesquelles on 
donne, en general, un poids plus important aux observations 
centrales, et rnoins important aux observations plus eloignees du 
centre. 

Si le nombre des observations choisies pour les moyennes mobiles 
est pair, il sera necessaire de les centraliser dans les memes 
instants de temps ou se situent les observations initiates. 

Le tableau suivant expose les operations necessaires pour /i=4. 



Doniws 


Som me des 
groupes de 4 

ohsorva Lions 


Moyennes 

mobiles d'ordre 

4 


Moyepne mobiles 
centrees 


t; 


Yn 








t : 


Ytz 








h 


Yr. 


IV, 


"*£-I/4£Y, 


Y}=1/2IY : .i+Y;r,l 


u 


Yh 


Zv„ 


Ysfl/fLYy 


YrWss* y«sj 


h 


Yb 


TY„ 


~YZ,=1/41Y„ 


Yi'l/Z[Y*s* Yss] 
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<<. 



y 



N> 



in 



ft^4«£Yi 



Y P -1/2/Y 5 . 5 * Y„ 5 J 



Centrer des moyennes mobiles d'ordre pair est Equivalent h 
calculer des moyennes mobiles pond£r£es d'ordre impair. 
En effiet, v£rifions cette affirmation sur le tableau precedent: 



*-&-+M-$$»>+ip'.} 



= 0(^+2^ + 2^+2^ + ^) 

Comme on peut remarquer, la moyenne mobile centre d'ordre 4 
(Y3) calcutee pour l'instant fe, est la moyenne mobile pond£ree 
d'ordre 5 ou les valeurs extremes ont un poids £gal k la rnoitie du 
poids correspondant aux valeurs centrales. 

De m£me, on le peut verifier pour n'importe quel autre instant tj. 
Exemple: 

Calculer les moyennes mobiles d'amplitude 3 et d'amplitude 4 
pour les donn£es suivantes : 



/ 


Yt 


h=3 


ii=4 


1970 
1971 


1 
3 


6 


2 
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1972 


2 


5 


1,66 


6 


1,5 




1973 





4 


1,33 


7 


1,75 


1,625 


1974 




a- 


6 


2 


8 


2 


1,875 


1975 


4 


7 


2,33 


7 


1,75 


1,875 


1976 


1 


6 


2 


8 


2 


1,875 


1977 


1 













Sur les colonnes h=3 et h=4, vient en premier lieu la colonne des 
sommes mobiles et £ la suite les moyennes mobiles. 

Etant donne que chaque moyenne mobile est assoctee au milieu de 
I'intervalle de temps sur lequel elle a £t£ calcul£e, les moyens 
d'ordre trois se fixent dans le deuxi£me des trois annees sur 
lesquelles elles out ete calculfees. 



4 5 ............ .............,.,..--.........,..-.^..^- : - : ■-■■:■ ■■■; -;■-•■ .-.:—■■■--•■.•■-- Y/;"/' 




Senel 



1970 1971 1972 1973 1974 1975 1976 1977 



La methode des moyennes mobiles a deux inconvenients: 
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preincrement, elle ne donne pas de moyennes mobiles pour le 
premier et le dernier groupe de pGriodes de la s£rie. Au cas ou la 
serie chronologique serait composee d'un nombre limite 
d'observations, les valeurs omises peuvent repr£senter une 
importante perte d'information. 



2,5 
2 

1,5 
1 

0,5 




-~- 




Moyennes mobiles d'ordre 3 




Moyennes mobiles 

I' " ' i 



- 



— 



___ 



1970 1971 1972 1973 1974 1975 



2.5 
2 

1.5 
1 
0.5 



moyennes mobiles d'ordre 4 




1970 



moyennes mobiles 
d'ordre 4 



1971 



1972 



1973 
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Deuxtement, les moyennes mobiles "negligent" la plupart des 
valeurs precedentes de la serie chronologique. 

Ces deux inconvgnients sont redresses par la m£thode de lissage 
exponentielle 

2.- Methode de lissage exponentielle: 

La methode exponentielle de lissage d'une s£rie chronologique est 
definie de la fagon suivante : A' ; =er/ + (l- e)X,_, pour t > 2 . 

Ou X, est la s£rie chronologique lissee exponentiellement a la 
date t. 

Yt est la s£rie chronologique a la date t 
Jf M est la serie chronologique lissee exponentiellement h la 
date t-1 

9estle coefficient de lissage ;avec O<0<! 
On commence par poser: 

Ce qui donne X 2 - 0K, +(l - 9)X l 

= e>\+(i-e)v 1 

v ; =e>\ + 0-e)x> 

= er s + (i-8)(9K ; +(i-e)K I ) 

= Q)' l +(l-B)H)'' : +(l-e)'K 
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x 4 =er 4 + (i-e)A-, 

= e r t + (j - e)(er ; + (i - ejer, + (1 - e) : r, ) 

=eK 4+ (i-0)eK, + (i-e) : e)' 2 +(i-e) , r 1 

En generate, on obtient: 

.v,=eK+(!-e)er,_ 1 +(i-e)- , eK,_ 2+ ... + (i-e)'- | K l 

Cette demiere formule indique qu'une serie chronologique 
« lissee » a la date t, depend de routes les observations anterieures 
de la serie. 

Le coefficient de lissage 9 est choisi en fonction du degre de 

Jissage demande. Une valeur de 6 tendent vers (zero) produit 

un degre de lissage assez important. Par contre, une valeur 

eproche de 1 resulte un lissage assez limits de la serie en 
question. 

- 

Exemple: 

Pour pouvoir elaborer un systeme de prevision des ventes 
de sa filiale, une firme multinationale a releve, pendant une 
periode de 4 semaines, les ventes quotidiennes de la filiale en 
question. 

Les resultats de ce suh ie sont regroupes dans le tableau suivant: 
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Jours 






\ j 

i\ 


1 


2 


3 


4 


5 




en 
5 

6 

i 


1 


33 


45 


25 


12 


30 




2 


41 


41 


40 


9 


24 




3 


30 


57 


33 


20 


36 




4 


54 


58 


36 


25 


40 





Transformons d'abord Y tj en Yt et appliquons la methode de 
lissage exponentielle avec 6 = 0,25 et 9 = 0,75et representors 
graphiquement les resuHats. 





Dates t 


Yt 


Xt 

(teta=0,25) 


Xt(teta=0,75) 


S1 


1 


33 


33 


33 


2 


45 


36 


42 


3 


25 


33,25 


29,25 


4 


12 


27,9375 


16,3125 


5 


30 


28,453125 


26,578125 


S2 


6 


41 


31 ,58984375 


37,39453125 


7 


41 


33,94238281 


40,09863281 


8 


40 


35,45678711 


40,0246582 


9 


9 


28,84259033 


16,75616455 
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10 


24 


27,63194275 


22,18904114 


S3 


11 


30 


28,22395706 


28,04726028 


12 


57 


35,4179678 


49,761 81 507 


13 


33 


34,81347585 


37,19045377 


14 


20 


31,11010689 


24,29761 344 


15 


36 


32,33258016 


33,07440336 


S4 


16 


54 


37,74943512 


48,76860084 


17 


58 


42,81207634 


55,69215021 


18 


36 


41,10905726 


40,92303755 


19 


25 


37,08179294 


28,98075939 


20 


40 


37,81134471 


37,24518985 



Representation graphique: 




o - 



V ■■/'■■ ; -«"Xt 



X«WU-0.25) 
Xl0eia-0,75i 



— . ■mv/;..;^. ', ._ 



1 2 3 4 * 6 7 8 9 10 11 12 13 14 15 16 17 18 19 30 
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Remarque: 

Les moyennes mobiles et la ni£thode exponentielle sont des 
methodes relativement assez Iimit£es de reduction ou 
domination des fluctuations aleatoires dans le but de d£couvrir 
l'existence d'autres composantes. 
3.- Determination de la variation saisonniere: 

Les fluctuations saison nitres correspondent £ des variations 
qui peuvent avoir lieu durant tine ann£e ou m£me sur un 
intervalle de temps plus court: mois, semaine, jour. Dans le but de 
mesurer I'effet saisonnier, nous allons construire des indices ou 
coefficients saisonniers, qui ont pour objet de mesurer le degr£ de 
difference entre les saisons. 

Une condition necessaire pour l'£tude de la composante 
saisonniere est qu'on ait une s6rie chronologique suffisamment 
longue pour qu'on puisse observer ['existence de saisons. 
Les indices saisonniers sont calcules de la fa<;on suivante: 

L Extraire I'effet des fluctuations saisonnteres en calculant les 

moyennes mobiles. Si on utilise par exemple un module 

multiplicatif de serie chronologique, on aura: 

Y t =Tt*Q*Si*Ri 

Les moyennes mobiles eliminent Si et Rt. 
2. Calculer le rapport de la serie sur la moyenne mobile. On 

obtient: 
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Y 
— L — «5 f xA 
T,xC f ' ' 

Le r£sultat obtenu est une mesure de la variation saisonni£re et 
al6atoire, 

3. Pour chaque type de saison, calculer la moyenne des 
rapports obtenus au 2*™ point. Cette procedure extrait ou 
^limine la majority de la variation saisonntere. Cette 
moyenne est au fait une mesure des differences 
saisonnteres. 

4. Les indices saisonniers sont les rapports moyens obtenus au 
ym* p i nt ajustes pour s'assurer que 3'indice saisonnier 
moyen est £gal a 1'unite. 

Exemple: 

Le nombre de visiteurs d'une grande galerie d'exposition 
pendant les trois dernferes ann£es est consign^ dans le tableau 
suivant: 
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Trimestres 




i 


i 


1 2 


3 


4 


1 


1 

2 
3 


10 


9 


12 


15,5 


14 


14 


18 


21 


22 


21,5 


25 


30 



pouvoir mesurer le volume de variation saisonni£re. 



Dates t 


Yt 


M.M. d'ordre 4 


M.M.C. d'ordre 4 


YI/MMC4 


1 


10 








2 


9 








3 


12 


11,625 


12,125 


0,989690722 


4 


16 


12,625 


13,25 


1,169811321 


5 


14 


13,875 


14,625 


0,957264957 


6 


14 


15,375 


16,0625 


0,871595331 


7 


18 


16,75 


17,75 


1,014084507 


8 


21 


18,75 


19,6875 


1,066666667 


9 


22 


20,625 


21,5 


1,023255814 


10 


22 


22,375 


23,5 


0,914893617 


11 


25 


24,625 






12[ 30 









Si Ton regroupe les rapports par trimestre, nous pouvons 
constater les similarity pour chaque type de trimestre et les 
differences entre les differentes types de trimestres. 
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Une fois, les donn£es sont groupies par trimestre, on calculera la 
moyenne des valeurs pour chaque trimestre, pour eliminer ou 
£purer la variation al£atoire. 

La derni£re gtape consiste ^ ajuster les moyennes en divisant 
chacune d'elles par la somme des quatres moyennes et en 
multipliant par 4 (nombre de trimestres par an), on obtiendra alors 
les indices saisonniers. 



^\Tr i mestres 


1 


2 


3 


4 


Total 


1 






0,99 


1,17 




2 


0,957 


0,872 


1,014 


1,067 




3 


1,023 


0,915 








Moyennes 


0,99 


0,893 


1,002 


1,118 


4,004 


Coefficient 

Sais=onnier 
(S,) 


0,989 


0,893 


1,001 


1,117 


4 



Les indices saisonniers indiquent qu'en moyenne, le nombre de 
visiteurs de la galerie des l" r et 2<™ trimestre sont inferieures A la 
moyenne annuelle, alors que le nombre de visiteurs pendant le 
4* nw trimestre depasse la moyenne annuelle. 
Representation graphique des indices saisonniers: 
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^-Determination de la variation r£siduelle: 

Une fois les coefficients saisonniers, Si, determines, Involution des 
variations rfeiduelles s'effectue en prenant le rapport des 
combinaisons (St.Rt) k St. Cest ce k quoi on a proc&te dans le 
tableau suivant: 



^\Trimestres 
Annies ^\^^ 


1 


2 


3 


4 


1 






0,989 


1,047 


2 


0,968 


0,976 


1,013 


0,955 


3 


1,034 


1,025 
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Exercices 



Exercice n°l: 



On consid£re les ventes trimestrielles d'un produit depuis 4 
ans (Ventes en milliers d'unites) : 



Trimestres 


1 


2 


3 


« 


Ventes premiere annee 


150 


80 


110 


205 


Ventes deuxieme annee 


170 


95 


125 


215 


Ventes troisieme annee 


180 


105 


115 


240 


Ventes quatrieme annee 


195 


no 


150 


255 



1 Calculer les moyennes mobiles de longueur 4. 

2. Repr£senter graphiquement les ventes trimestrielles et 
les moyennes mobiles (sur le meme graphique). Qu'est 
ce que vous remarquez ? 

3. Calculer les indices saisonniers pour chaque trimestre. 

4. Determiner la variation residuelle. 

5. Appliquer la mfthode exponentielle de lissage avec 
0=0,75 et representor graphiquement les r£sultats. 
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Pour pouvoir ^laborer un systeme de prevision des ventes 
de sa filiate, une firme multinationate a relev£ pendant une 
periode de 4 ans, les ventes trimestrielles de la filiale en question. 

Les r£sultats de suivie sont regroup£s dans le tableau 
suivant : 









Trimestres 






1 


2 


3 


4 




1 


33 


45 


25 


12 


en 
m 
<4J 


2 


41 


41 


40 


9 


c 

c 

< 


3 


30 


57 


33 


20 




4 


54 


58 


36 


25 



1. Calculer les moyennes mobiles de longueur 4. 

2. Representer graphiquement les ventes trimestrielles et les 
moyennes mobiles (sur le m§me graphique). Qu'est ce que 

vous remarquez ? 

3. Calculer les moyennes mobiles centres de longueur 4. 

4. Calculer les indices saisonniers pour chaque trimestre. 
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5. Determiner la variation r£siduelle. 

6. Appliquer la m£thode exponentielle de lissage avec 6=0,75 
et repr£senter graphiquement les r£sultats, 

7. La direction de l'entreprise estime que la tendance des 
ventes de sa filiate est linSaire. Analyser la tendance de ces 
ventes en utilisant la methode des moindres carr£e. 

8. Etudier la qualite de cette representation en calculant le 
coefficient de correlation. Conclure. 
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itre8i 

Les nombres indices 

l- Introduction et definition : 

On designe par indice la grandeur statistique avec laquelle on 
mesure les variations dans le temps d'une variable ou d'un 
ensemble de variables d£pendantes. On appelle tableaux 
d' indices, 1' ensemble des indices correspondant & plusieurs 
annees, plusieurs local ites, etc... 

A l'aide des indices on pourra, par exemple, comparer le cout 
de la vie dans une ville, durant une certaine ann£e, avec celui des 
annees pr£c£dentes, ou, par exemple, la production annueLle 
d'acier d'un pays avec celle d'un autre pays... etc. Les indices 
trouvent leurs applications dans de nombreux domaines : les 
affaires, l'^conomie, l'6ducation la sociologie, ...etc. 

Cest pourquoi de nombreux organismes gouvernementaux et 
pxiv& sont engages dans le calcul des indices. Afin de pr^voir les 
affaires et les conjonctures economiques. Ces organismes 
rassemblent sans cesse des informations d'ordre g£n£ral. On 
distingue ainsi l'indice des salaires, de la production, du 
chdmage, des naissances, ... etc. 

Le plus connu, peut etre le plus exploits, est celui du cout de la 
vie ou indice des prix a la consommation, mis au point par le 
« Bureau of Labor Statistics ». Au Maroc, les indices et les 
indicateurs Economiques sont etablis par la « Direction de la 
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Statistique » (c6te public) et par le « Centre Marocain de 
Conjoncture (CMC) », (cdt£ priv£). 

II existe deux categories d'indices : les premiers se referent 
a des grandeurs simples et les secondes correspondent k des 
grandeurs complexes. 

II- Indices simples : 

1- Definition : 

1 

Les grandeurs etudi^es (economiques, sociales, 
culturelles...) prennent des valeurs variables au cours du temps 
ou dans l'espace. En comparant ces differentes valeurs en terme 
de rapport on obtient un indice.simple ou £l£mentaire. 
Exemple : 

Soit P le prix d'un certain livre en une date foet soit Pj le prix du 

meme livre en une deuxiSrne date tj. 

Soit Po=50 DH et P 7 = 60 DR 

Pour ^valuer la variation du prix du livre, on pent dire qu'elle est 
de: 

• Pi - Po= 60 -50=10 DR soit une augmentation de 
±gxl00=20%. 

• 5Q = ' i20 c'est-a-dire que le prix a ete multiple par 1,2. 

• (l,2O)XlO0=12O^valeurl00enfo 

=>valeurl20enfr 
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(^xlOOJ represente un indice de prix. 

Lorsque l'indice porte sur une seule grandeur, on I'appelle indice 
simple ou £l£mentaire, il se note d'une maniere g£n6rale : 
Indice des prix : 

7rt)=-fl-xl00 avec flest le prix en une date f 

/T) 

et R le prix de reference. 

Indice de valeur : 

/„ = ¥lx\ 00 avee V est la valeur en une date t 

Vo 

et Mi la valeur de reference. 

Ces indices sont exprimSs en pourcentage et n'ont pas de 
dimension et servent par consequent h comparer des valeurs 
differentes, qui ont des unites differentes. lis ne sont pas toujours 
lies au temps mais peuvent Stre par rapport & I'espace (La ville, le 
pays, le lieu...) En utilisant le temps, la p£riode de reference (0) 
s'appelle la p£riode de base. 

Exemple : 

Supposons que le prix d'achat d'un litre de lait ait ete 1,20 DH en 

1%5 et 2,O0DH en 1985. 

En prenant cornme annee de base 1965, on a : 

/ S965iw =-2_xl 00=166% 
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Ce qui signifie que le prix du lait a m en 1985, 166% eelui de 

1965, ou a augmente de 66% de 1965 a 1985. 

En prenant com me annee de reference 1985, on a: 

/io*5!965 a^& 00=60% 

Ce qui signifie que le prix du lait a et£ en 1965, 60% fois celui de 
1985, ou a diminue de 40% entre 1985 et 1965. 
Remarque : 

Pour all£ger l'&rriture aussi bien que les quelques demonstrations 
qui vont suivre, nous noterons I'indice sous 3a forme : 




en omettant le facteur multiplicatif 100 
2- Proprietes des indices el^mentaires : 

Les indices sont souvent l'objet de modifications; ces 

modifications sont possibles grace aux propri£t£s que verifient ces 

indices. 

a- Identite : 

L'indice correspondant £ une meme periode donnee par rapport k 
la m£me periode est de 100%, 

Am = /a = 100% 

i 
b- Circularite : 

Les indices Slementaires peuvent changer d'ann&? de base par la 
r£gle de circularity : 
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On d£duit 



It/0 = hjs ' Is/O 



Cette propriete permet de comparer, non seulement les periodes 
et t d'une part et et s d'autre part, mais aussi t et s. 




La comparaison se fait ind£pendamment du choix de la p£riode 
de reference 0. 

Exemple: 

On a note les informations suivantes concemant le prix d'un 

paquet de cafe moulu 250g, marque « X » dans une ville « Y » : 



Epoques 


Prix paquet 


Indices 




de 250g (en DH) 


Annee de base 1998 


1998 


11 


100 


1999 


12,65 


115 


2000 


15,18 


138 



Supposons que Ton veuille changer de base, en prenant (1999) 
pour periode de base. 

• Par application de la definition, on a : 

/:(Wi99 9 =J44l xl0O=120 
12,65 

• Par application de la propriete de circularity on a : 

/20WH99» = /:OOQ-|*WX /|9W998 



alors 



/ 20001999 = 



I200jyig98 

/i 094 (998 
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et on le multiplie par 100 pour 1'exprimer en pourcftntage, on 
obtient : 

1199^1998 1 15 



o Reversibilite : 



On a: 



Ou bien 



I 



Po Po/Pr 



1 c'est-^-dire 




/,/0 •/()//=! 



Cette propria est interessante surtout lorsque Ton se refere a un 
critere qui n'est plus le temps. Par exemple, si on compare le prix 
(fun produit au Maroc au prix du m^me produit en Espagne, on 



aura : 



I Maroc /Espagne — 



1 



/ Espagne /Maroc 
d- Transferability ; 
La 2* me propria entratnee par la circularite de l'indice simple est 
la transferability de l'indice. On aura : 



L/0=Itfi-] • It~lft-2 • It-%t-3 . . . Il/O 



Ceci signifie que I'on obtient l'indice de la date t par rapport a 
en faisant le produit des indices intermediates d'une date par 
rapport h l'autre. 
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HI- Indices composes r 

1- Definition : 

Les grandeurs que Ton £tudie, le plus souvent, sont des 
grandeurs composees d'un grand nornbre d'£lements mesur£s par 
des grandeurs simples. Ators, I'indice qui synthftise plusieurs 
indices simples s'appeile indice compos* ou synth£tique. 

2- Emploi des movennes : 

Comme il faut aboutir h un indice unique resumant une 
grande quantite d'informations, on peut faire appel au calcul des 
moyennes pour construireces indices. 

Deux possibility se presentent : soit on considere I'indice 
des moyennes, soit la rnoyenne des indices. 

a- Indice des movennes arithm&iques ponderees : 

On note par *HU le prix d'un certain produit « I » a la 

date t et on note 2w la quantite consomm6e de ce produit 

« i ». 

Supposons que Ton veut calculer I'indice synth£tique des 
prix de « k » produit (;=l,2,...,fc) a la date / , en prenant la 

date comme base. 

Aiors I'indice des moyennes arithmetiques ponderees est 



/ k 



£fi<OW)/£G(0 

I„ v = ig Uzl x 1 00 

£e(/)Po(o/£fiO') 
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ou on a consider* les quantity Q(/)comme coefficients de 

pond£rations. 

Les ponderations sont necessaires puisque les produits 

composant I'indice ne doivent pas etre affects de la meme 

mesure (par exemple, le pain dans I'indice general des prix a un 

poids plus important que la mayonnaise !). 

b- Movenne arithmetique ponderee des indices simples : 
Dans ce cas, on determine d'abord I'indice simple propre pour 
chaque produit « I », et ensuite, on fait la moyenne arithmetique 
ponder4e des indices simples affectes a leur pond£ration. 
Mors la moyenne arithmetique ponderee des indices simples est : 



ftfi" 




<100 


iQ(i) 



Ex em pie : 

Soient *t(l) les prix de quatre produits /=1 ,2,3,4 a une date t 

etsoient Q(i) ; 1=1 ,2,3,4 leursquantitesconsommees. 



Produits 


Prix unitaires (en DH) 


Quantites 

QU) 


ft(0 


P<(0 


1 


10 


14 


4 


2 


12 


13 


5 


3 


15 


IS 


3 


4 


3 


5 


8 
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- Calculons I'indice des moyennes arithm£tiques 
pond£r£es ( date de reference £tant 0) : 

^ (4xl4H(5xl3)+(3xl5)4-(8x5)/4+5+3+8 inf) 
fi ~ (4x10 H(5xl2 )+(3Xl5 )+(8x3)/4+5+3+8 

Le r£sultat signifie qu'on depense 121,90 DH en t pour se 
procurer les memes quantites de produits qui coutaient 100 DH 
en date de base; e'est-a-dire que I'augmentation entre ces deux 

dates a 6te de 21,9%. 

- Calculons la moyenne arithm£tique pond£ree des indices 

simples (date de base £tant 0) : 

/* = 10 A ] l iJ 5 2 - xl0 ° = on Xl0 ° 

4 + J + J + o — U 

done 

/,, o = 27_J5_ xl0O=136 75 

Remarque : 

Dans les deux indices precedents, on a suppose que les 
quantites consommees soient les memes en date t qu'en date de 
base; alors que les quantites consommees peuvent-elles aussi 
varier entre ces deux dates. 
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1- Indices de Laspevres (1834 - 1913) : 

Pour Laspeyres, les pond£rations s'etfectuent pour la 
p£riode de base. En distinguant les deux cas pr£c£dents, on 
obtient les indices suivants ; 

• Cas de l'indice des moyennes arithmetiques pond£r£es : 



lQo(/)/?(/) 
L,o = 4g xl 00 

2>(«)ft(0 



i=l 



Cas des moyennes arithmetiques pond£r£es des indices 
simples : 




• Si on considere l'indice des prix, alors e'est le rapport des 
depenses totales ou seuls les prix sont variables. 

• Si on consid^re l'indice des quantites, alors e'est le rapport 
des depenses totales ou seules les quantity sont variables. 

2- Indices de Paasche (1851 - 1925) : 
Dans ce cas, les pond^rations se font pour la p&iode considers £ 
Deux cas se distinguent : 

• Cas de l'indice des moyennes arithmetiques pond. 



lerees : 



60 



>€ETlttJP ! 



.com 



Statistique Descriptive 



Les nombres indices 




Cas des moyennes arithmetiques ponderees des indices 
simples : 




Tableau recapitulatif : 



Indices 


Laspeyres L 


Paasche P 


PrixP 


<-§>» 


fl HS£* ,o ° 


Quantites Q 


^%M™ 


ft =Hx' M 


Valeurs globales 


L " = fl -=£§^< 100 



Exemple : 

Quatre produits j=l, 2, 3, 4 sont donnes avec prix Pa et quantites 
Qu en des dates i-0, t 



Produits; 


Date de base 


Datef 


P«i 


Q» 


Pti 


Q« 


1 

2 


12 

5 


6 
13 


15 
8 


7 
11 
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3 

4 


15 
8 


9 
10 


13 
10 


18 
9 



Calculer les indices cle Laspeyres et Paasche correspondants aux 
prix, aux quantites et aux valeurs globales : 



Produits 


PoQo 


PtQt 


PoQ, 


P,Q° 


1 


72 


105 


84 


90 


2 


65 


88 


55 


104 


3 


135 


234 


270 


117 


4 


80 


90 


72 


100 


Totale £ 


352 


517 


481 


411 



^ = S§^ Xl °° = 352 Xl °° = 2 J 6 ' 76 






be = ^T„x l 00=512x1 00 = 1 46,86 



^=5^4x1 00=4i?xl 00 m 1 07,48 






481 



x100=4tr x l 00=1 25.79 
411 



ft* = Jtttt-x' 00=|i?xl 00= 1 46,86 

Remarque : 



ioo ' ioo -**-^ 
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Pour 1'exemple pr£c6dent, 

(H6J6)(I25.79) _ (136,65)(107 ? 48) _ 1 ^ R7 
100 " 100 * 

3- Indices de Fisher : 

Le fait de considerer la meme quantite consomm£e pour 

les deux dates n'est pas satisfaisant. On peut rem&lier 
partiellement A cet inconvenient en considerant un autre indice 
qui est l'indice de Fischer. II est donn£ par la moyenne 
g£om£trique des indices de Laspeyres et de Paasche : 

Fp=^LpPp (p r i x ) 

fe^I^R) (Quantity 

4- Proprtetes des indices composes : 

• L'indice des moyennes arithm^tiques pond£rees des 
differentes £poques est reversible et transferable {& la 
condition que la ponderation ne change pas d'une periode 
h l'autre). 

• L'indice compose, moyenne arithm£tique ponderee des 
indices simples n'est gSneralernent ni reversible, ni 
transferable. 

• Aucun des trois indices (de Laspeyres, de Paasche, de 
Fisher) ne poss£de la propriete de circularite. 

• L'indice de Fisher est reversible. 
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IV- Les indices dans la vie Economique : 

II est de plus en plus necessaire, pour gerer les affaires d'un pays, de 
connaitre, a lout moment, la situation economique de celui-ci. 
Toute evolution doit etre suivie avec regularite d'ou la necessity de 
calculer des indices analogues a ceux que nous avons introduits dans ce 
chapitre. 

Au Manx, La Direction de la Statistique m£ne des 
enquetes p£riodiques dans le domaine Sconomique et social. Les 
donn£es obtenues £ partir de ces enqueues servent a Elaboration 
des indices qui permettent de suivre la conjoncture economique 
du pays. La formule employee pour le calcul des indices au 
Maroc est celle de Laspeyres. 

Une etude approfondie de ces indices, publics par la 
Direction de la statistique, nous entrainerait dans des details que 
nous ne pouvcms pas developper ici sans alourdir 
considSrablement ce chapitre. Mais ceci montre 1'importance prise 
par les indices synthetiques dans la vie economique. 

Aucune provision, aucun plan de developpement ne 
saurait se faire sans les prendre en consideration. 
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Exercices 



On dispose des informations sur les salaires moyens d'une 
entreprise industrielle secteur par secteur et son nombre de 
salaries : 



Secteurs 


Salaire 


Salaire 


Nombre en 


Nombre en 




moyen en to 


moyen en ti 


to 


ti 


1 


5800 


6000 


250 


241 


2 


6200 


6250 


300 


320 


3 


5920 


6080 


120 


122 


4 


6150 


6300 


45 


43 



L'entreprise desire connaftre revolution generate de ses salaires 

entre to et ti. 

Calculer les indices de Laspeyres et de Paasche. 

Exercice 2 : 

On donne les prix et les quantites de deux produits A et B dans 

deux villesOet 1. 



Produits 


Ville 


Ville 1 


Prix 


Quantites 


Prix 


Quantites 


A 
B 


100 
10 


100 
50 


10 
200 


80 
80 



1) Calculer I'indice de Laspeyres des quantites de la ville 1 
par rapport A la ville 0. D'apr£s cet indice, quelle est la ville 
quia le plus produit? 
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2) Caiculer un nouvel inclice de Laspeyres, en prenant pour 
base la ville 1. Peut-on conclure de la meme manifere qu'au 

U? 

3) Caiculer les indices de Paasche de bases les villes et 1. 
Que peut-on conclure ? 

Exgrcice 3 : 

On donne la moyenne des prix de gros et la production de lait, de 
beurre et de fromage dans un pays donne pour les ann£es 1999, 
2000 et 2001. 



Produits 


Prix (par Kilo ou litre) 


Quantites (millions de 
Kilo) 


1999 


2000 


2001 


1999 


2000 


2001 


Lait 

Beurre 

Fromage 


0395 
6,15 
3,48 


0,389 

6,22 

3,54 


0,413 
5,97 
3,89 


9675 
117,7 
77,93 


9717 
115^ 
74,39 


10436 
115,5 

82,79 



1) Caiculer un indice global des prix de gros de ces produits 
pour l'ann£e 2001 : 

• En choisissant 1999 comme ann£e de base. 

• En choisissant 1999-2000 comme p£riode de base. 

2) Caiculer 1'indice de Laspeyres des prix pour L'ann€e 2001 : 

• En choisissant 1999 comme annee de base. 

• En choisissant 1999-2000 comme periode de base. 

3) Caiculer 1'indice de Paasche des prix pour l'annee 2001 : 

• En choisissant 1999 comme annee de base. 



En choisissant 1999-2000 comme periode de base. 
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Annexe 



Annexe : 



Interpolation lineaire 



Effectuer une interpolation lineaire entre deux points Ma, f(a)) et 
B(b. f(b» de la courbe representative C f d'une fonction /, c'est 
supposer qu'entre ces deux points la fonction peut etre remplacee 
par une fonction lineaire (qu'il faudra determiner), afin d'effectuer 
d'eventuelles previsions des valeurs de/inconnues. 

En statistique, souvent, on a des donnees qui manquent ou 
aberrantes. Mors, l'interpolation lineaire nous permet de 
retrouver une valeur approchee de telles valeurs. 



Par exemple, soit la situation suivante : 



jgi-i, eil 



[3000, 3500[ 
(3500, 4000[ 



ni 



15 



20 



On veut avoir la valeur ni qui correspond a la classe [3000, 3200[ 

x-15 3200 - 3000 
Mors, on a, par interpolation lineaire ^-^ - — _ 3O0Q 



200 . ,. 
.* = XS+15 

500 



A 



= 17 
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Cet ouvrage de 5tatisttque Descriptive sadresse aux 
etudiants de la premiere annee universitaire, premier et 
deuxieme semestres de toutes les filieres de la nouvelle 
generation des Licences Pondamentales en sciences, 
sciences economiques et gestion...ainsi quaux etudiants de 
la premiere annee des ecoles dingenieurs et des ecoles 
superieures de commerce et gestion. 

C'est un support de cours et des exercices, presentant 
les notions de-base del a Statistique II dispense, done, les 
etudiants de prendre des notes de cours, neanmoins, il les 
invite a faire un bon nombre dexercices, extraits des 
controles et des ewamens, presentes a la fin de chaque 
Chapitre. 
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